SenseVoice - 阿里最新开源精准多语言语音识别与情感辨识模型本地一键整合包下载

最新推荐文章于 2025-04-03 10:21:11 发布

昨日之日2006

最新推荐文章于 2025-04-03 10:21:11 发布

阅读量1.8k

点赞数 6

分类专栏： ai语音文章标签：语音识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yihuaixu/article/details/140297499

版权

ai语音专栏收录该内容

18 篇文章

订阅专栏

阿里巴巴近期发布了开源语音大模型项目FunAudioLLM，该项目包含了两个核心模型：SenseVoice和CosyVoice。可以精准多语言识别并且进行语音克隆

本地一键包下载地址： SenseVoice - 精准多语言语音识别与情感辨识模型本地一键整合包下载

SenseVoice：精准多语言识别与情感辨识

SenseVoice主要致力于高精度多语言语音识别、情感辨识和音频事件检测，经过40万小时数据训练，支持超过50种语言的识别，其效果显著优于现有的Whisper模型，尤其在中文和粤语识别上提升超过50%。该模型不仅能够准确识别语音，还能辨别音乐、掌声、笑声、哭声、咳嗽和喷嚏等常见人机交互事件。多方面的测试显示，SenseVoice在情感辨识能力上也取得了行业领先的成果，能够检测到多种情感表现。

CosyVoice 这里就不多介绍，可以参考之前发布的一键包，CosyVoice一键包点此进入

本地测试了多轮音频，识别能力还是挺棒的，相比Whisper，SenseVoice的中文识别能力更胜一筹，精准度也更高。

使用也很简单，下载一键包，双击一键启动，进入WebUI界面

上传一段需要识别的音频，点开始即可

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。