OpenAI称其正在研究模仿人类声音的人工智能

最新推荐文章于 2024-07-12 23:11:20 发布

北京王老师

最新推荐文章于 2024-07-12 23:11:20 发布

阅读量321

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/se_jw/article/details/137411807

版权

OpenAI发布了一款新的人工智能工具，可以以惊人的准确度模仿人声。

人工智能语音生成器具有广泛的潜在应用，包括无障碍服务，但也可能引发人们对错误信息和其他形式的滥用的担忧。

OpenAI上周五分享了这款名为“语音引擎”的工具的早期测试样本。该工具使用一段15秒的说话样本，生成令人信服的声音复制品。然后用户可以提供一段文本，该工具将用人工智能生成的声音朗读。

目前已经有几种人工智能生成的声音服务向公众开放，但正如它在突破性聊天机器人ChatGPT上所做的那样， OpenAI已被证明特别擅长获得人工智能工具的广泛采用。

该公司表示，一种基于人工智能的文本语音转换工具可以帮助翻译、为儿童提供阅读辅助或帮助失去说话能力的人。但一些怀疑论者担心，它也可能助长虚假信息的产生，或使欺诈行为变得更容易。

OpenAI表示，语音引擎目前仅被“一小群值得信赖的合作伙伴”使用，包括教育和医疗技术公司，它将利用他们的测试来决定是否以及如何允许更广泛的使用。据该公司称，这些测试者已经同意，在未经明确同意的情况下，不会再现人们的声音，并向听众清楚地表明，他们听到的声音是由人工智能生成的。

OpenAI在一篇博客文章中表示：“我们意识到，生成类似人类声音的语音存在严重风险，在大选年尤其需要注意。”该公司承认，随着人工智能生成的音频变得更加广泛，需要进行重大变革，尽管它不打算立即向公众发布语音引擎。例如，该公司建议逐步淘汰基于语音的银行账户认证。

OpenAI表示：“任何广泛部署合成语音技术都应该伴随着语音认证体验，以验证原始说话者是在有意将他们的声音添加到服务中，并建立一个禁止使用的声音列表，以检测和阻止与知名人物过于相似的声音的创建。”

语音引擎可以使用一种语言的声音样本来创建一个可以用多种语言说话的复制语音。

它的博客文章包括一个人类朗读有关友谊的文章的音频剪辑示例，以及人工智能生成的听起来像同一个人用西班牙语、普通话、德语、法语和日语朗读同一篇文章的音频。在每个人工智能生成的样本中，都保持了原始说话者的语调和口音。

在用户等待OpenAI上个月发布的人工智能生成视频工具Sora公开发布之际，OpenAI发布了Voice Engine预览版。Sora可以根据文本指令创建看起来逼真的60秒视频，能够提供带有多个角色、特定类型的动作和精细背景细节的场景。OpenAI的ChatGPT也可以根据文本提示生成图像。

另外， OpenAI周一还宣布，它正在使ChatGPT对任何人开放，不需要注册即可使用该服务。

该公司指出，它可能会使用任何加载到ChatGPT的文本来改进其模型，但表示即使没有帐户，也可以通过设置关闭。然而，没有帐户，用户将无法保存或查看聊天历史记录，或访问各种功能，包括语音对话和自定义说明。

关注