目前,文本到语音技术已经变得非常流行。由于应用范围广泛,许多技术公司正在努力开发新技术并带来更自然,更流畅的效果。最近,微软开发了人工智能语音技术,只需少量培训。
文本生成的语音技术需要大量的数据进行训练和调整,才能达到自然效果,但微软最近开发的人工智能技术可以使用200个声音样本,即约20分钟的录音,自动生成高保真语音,比传统技术节省了大量时间。这次,使用深度神经网络技术,输入文本直接连接到声音库,语音的生成更有效,甚至可以快速生成更复杂的文本。
据研究人员称,虽然技术产生的语音仍然不完善,但可读性已达到99.84%,这意味着在大多数情况下,语音可以被正确理解。仲博VR新技术将大大降低文本生成语音的技术门槛。即使是中小型公司也可以轻松创建自己的语音系统,而无需投入大量资源。但是,微软还没有推出使用这项技术的相关产品,而且从官方发布还有一段时间。