了解如何将音频转换为文本
语音转文本 API 提供两个端点,transcriptions
以及translations
,基于我们最先进的开源大型 v2 Whisper 模型。它们可用于:
- 将音频转录成音频所使用的任何语言。
- 将音频翻译并转录成英文。
文件上传目前限制为 25 MB,并且支持以下输入文件类型:mp3
、、、、、、、和mp4
。mpeg
mpga
m4a
wav
webm
转录 API 将您要转录的音频文件和音频转录所需的输出文件格式作为输入。我们目前支持多种输入和输出文件格式。
curl --request POST