audio/speech 端点。与此端点兼容的模型是 gpt-4o-mini-tts、tts-1 和 tts-1-hd。使用 gpt-4o-mini-tts,您可以要求模型以某种方式或以某种语调说话。audio/transcriptions 端点。与此端点兼容的模型是 gpt-4o-transcribe、gpt-4o-mini-transcribe 和 whisper-1。通过流式传输,您可以持续传入音频并获得持续的文本流。| API | 支持的模态 (Supported modalities) | 流式传输支持 (Streaming support) | 
|---|---|---|
| Realtime API | 音频和文本输入和输出 | 音频流输入和输出 | 
| Chat Completions API | 音频和文本输入和输出 | 音频流输出 | 
| Transcription API | 音频输入 | 音频流输出 | 
| Speech API | 文本输入和音频输出 | 音频流输出 | 
audio/transcriptions 和 audio/speech 端点配对,以获取口头用户输入,处理和生成文本响应,然后将其转换为用户可以听到的语音。modalities 数组中包含 audio 并使用音频模型,如 gpt-4o-audio-preview。