OpenAI(ChatGPT)
  • 介绍
  • 项目说明
  • 导言
  • 身份验证
  • 发出请求
  • 参数详情
  • 音频(Audio)
  • 聊天(Chat)
  • 自动补全(Completions)
  • 嵌入(Embeddings)
  • 微调(Fine-tuning)
  • 文件(Files)
  • 图像(Images)
  • 模型(Models)
  • 审查(Moderations)
  • 助手测试版(AssistantsBeta)
  • 线程数(Threads)
  • 留言(Messages)
  • 运行(Runs)
  • 已弃用-音频(Audio)
    • 创建转录POST
    • 创建翻译POST
Powered by Apifox

    创建转录

    POSThttps://api.openai.com/v1/audio/transcriptions

    了解如何将音频转换为文本。

    相关指南:语音转文本

    将音频转录为输入语言。

    请求参数

    Header 参数
    Content-Type
    string 
    必需
    示例值:
    multipart/form-data
    Accept
    string 
    必需
    示例值:
    application/json
    Authorization
    string 
    可选
    示例值:
    Bearer {{YOUR_API_KEY}}
    Body 参数 (application/form-data)
    file
    file 
    必需

    要转录的音频文件,采用以下格式之一:mp3、mp4、mpeg、mpga、m4a、wav 或 webm。

    model
    string 
    必需

    要使用的模型的 ID。仅whisper-1当前可用。

    示例值:
    whisper-1
    prompt
    string 
    可选

    可选文本,用于指导模型的风格或继续之前的音频片段。提示应与音频语言相匹配。

    示例值:
    eiusmod nulla
    response_format
    string 
    可选

    成绩单输出的格式,采用以下选项之一:json、text、srt、verbose_json 或 vtt。

    示例值:
    json
    temperature
    number 
    可选

    采样温度,介于 0 和 1 之间。较高的值(如 0.8)将使输出更加随机,而较低的值(如 0.2)将使输出更加集中和确定。如果设置为 0,模型将使用对数概率自动升高温度,直到达到特定阈值。

    示例值:
    0
    language
    string 
    可选

    输入音频的语言。以ISO-639-1格式提供输入语言将提高准确性和延迟。

    示例代码

    返回响应

    OK(200)
    HTTP 状态码: 200
    内容格式: JSON
    数据结构
    text
    string 
    必需
    示例OK
    {
      "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
    }

    扫码加入 Open AI(ChatGPT)微信交流群

    欢迎加入 Open AI(ChatGPT) 交流群!让大家可以分享和讨论有关 Open AI(ChatGPT)API 的开发和使用等相关话题。

    扫码加入交流群
    修改时间 5 个月前
    下一页
    POST创建翻译