该公司表示,一种基于人工智能的文本语音转换工具可以帮助翻译、为儿童提供阅读辅助或帮助失去说话能力的人。但一些怀疑论者担心,它也可能助长虚假信息的产生,或使欺诈行为变得更容易。
OpenAI在一篇博客文章中表示:“我们意识到,生成类似人类声音的语音存在严重风险,在大选年尤其需要注意。”该公司承认,随着人工智能生成的音频变得更加广泛,需要进行重大变革,尽管它不打算立即向公众发布语音引擎。例如,该公司建议逐步淘汰基于语音的银行账户认证。
OpenAI表示:“任何广泛部署合成语音技术都应该伴随着语音认证体验,以验证原始说话者是在有意将他们的声音添加到服务中,并建立一个禁止使用的声音列表,以检测和阻止与知名人物过于相似的声音的创建。”
语音引擎可以使用一种语言的声音样本来创建一个可以用多种语言说话的复制语音。
它的博客文章包括一个人类朗读有关友谊的文章的音频剪辑示例,以及人工智能生成的听起来像同一个人用西班牙语、普通话、德语、法语和日语朗读同一篇文章的音频。在每个人工智能生成的样本中,都保持了原始说话者的语调和口音。
在用户等待OpenAI上个月发布的人工智能生成视频工具Sora公开发布之际,OpenAI发布了Voice Engine预览版。Sora可以根据文本指令创建看起来逼真的60秒视频,能够提供带有多个角色、特定类型的动作和精细背景细节的场景。OpenAI的ChatGPT也可以根据文本提示生成图像。
另外, OpenAI周一还宣布,它正在使ChatGPT对任何人开放,不需要注册即可使用该服务。
该公司指出,它可能会使用任何加载到ChatGPT的文本来改进其模型,但表示即使没有帐户,也可以通过设置关闭。 然而,没有帐户,用户将无法保存或查看聊天历史记录,或访问各种功能,包括语音对话和自定义说明。