阿里 FunAudioLLM:增强人类和 AI 用自然语音交互

 是阿里通义团队发布的用于增强人和 LLMS 语音交流的框架,包含了:

  • SenseVoice:支持 50 多种语音和情感识别的语音识别
  • CosyVoice:支持多语言、跨语言、语音克隆,自然情感语音生成

都在 modelscope 上有免费试用,FunAudioLLM 能够轻松与 LLMS 集成,能实现语音翻译、情感语音聊天、交互式播客和有声读物等。

整体效果比起之前字节的 Seed-TTS 略差,不过强在开源了,并且现在你就可以直接用了!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值