OpenAi 语音转文字

最新推荐文章于 2024-05-14 19:08:00 发布

mypc56

最新推荐文章于 2024-05-14 19:08:00 发布

阅读量652

点赞数

文章标签：人工智能 gpt-3 python

原文链接：https://platform.openai.com/docs/guides/speech-to-text/prompting?lang=python

版权

本文介绍了OpenAI的语音转文本API，该API基于Whisper模型，支持多种语言的转录和翻译。用户可以将音频文件转换为文本，API支持多种输入和输出格式，并提供了提示功能来提高转录质量。

摘要由CSDN通过智能技术生成

了解如何将音频转换为文本

介绍

语音转文本 API 提供两个端点，transcriptions以及translations，基于我们最先进的开源大型 v2 Whisper 模型。它们可用于：

将音频转录成音频所使用的任何语言。
将音频翻译并转录成英文。

文件上传目前限制为 25 MB，并且支持以下输入文件类型：mp3、、、、、、、和mp4。mpegmpgam4awavwebm

快速开始

转录

转录 API 将您要转录的音频文件和音频转录所需的输出文件格式作为输入。我们目前支持多种输入和输出文件格式。

curl --request POST

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
OpenAi 语音转文字

该模型将尝试匹配提示的样式，因此如果提示也是如此，它更有可能使用大写和标点符号。然而，当前的提示系统比我们的其他语言模型要受限得多，并且只能对生成的音频提供有限的控制。要保留被拆分成多个片段的文件的上下文，您可以使用前一个片段的转录本提示模型。例如，下面的提示改进了单词 DALL·E 和 GPT-3 的转录，这两个单词之前写为“GDP 3”和“DALI”。{ "text": "想象一下你曾经有过的最疯狂的想法，你很好奇它如何扩展到 100 倍、1000 倍大的东西。大家好，我叫沃尔夫冈，来自德国。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。