audio/speech
端点。与此端点兼容的模型是 gpt-4o-mini-tts
、tts-1
和 tts-1-hd
。使用 gpt-4o-mini-tts
,您可以要求模型以某种方式或以某种语调说话。audio/transcriptions
端点。与此端点兼容的模型是 gpt-4o-transcribe
、gpt-4o-mini-transcribe
和 whisper-1
。通过流式传输,您可以持续传入音频并获得持续的文本流。API | 支持的模态 (Supported modalities) | 流式传输支持 (Streaming support) |
---|---|---|
Realtime API | 音频和文本输入和输出 | 音频流输入和输出 |
Chat Completions API | 音频和文本输入和输出 | 音频流输出 |
Transcription API | 音频输入 | 音频流输出 |
Speech API | 文本输入和音频输出 | 音频流输出 |
audio/transcriptions
和 audio/speech
端点配对,以获取口头用户输入,处理和生成文本响应,然后将其转换为用户可以听到的语音。modalities
数组中包含 audio
并使用音频模型,如 gpt-4o-audio-preview
。