TTS文本转语音工具更新,全新AI字幕识别导出~

图片

TTS工具有段时间没有更新了,不是小编偷懒,主要是这次更新包括优化的内容比较多,特别是优化的部分,需要大量时间分析测试,实在是快不起来,接下来容小编向大家详细汇报:

更新内容

1、增加:全新AI字幕识别功能

图片

老版本的AI字幕识别使用的whisper模型,效果还可以,最大的缺点是速度太慢,这次更新的AI字幕识别采用了阿里的开源语音大模型(sense-voice ),在中文字幕识别上效果显著优于whisper,识别率达到 95% 以上,如果你的系统性能足够,识别速度会非常非常快,小编电脑是8核16线程CPU+32G内存,从上图可以看到,1小时23分的音频,完成字幕识别用时仅3分30秒,目前唯一的缺点也是所有AI语音识别的共同缺点,就是少量文本识别不准确的问题,这个问题小编已经有一个初步的解决方案,到时候应该会以单独功能(字幕校对)和大家见面,敬请期待。

注意:字幕识别功能仅支持x64系统!

2、增加:微软、Edge多角色列表鼠标右键"设置角色"功能

图片

此功能是为了方便使用多角色的用户在想单独使用某个角色时,可以快速将角色列表中的角色数据同步为当前界面角色数据;

3、优化:解决Edge多线程合成内存错误问题,线程数提升至20线程

图片

EdgeTTS多线程合成内存错误问题一直以来都存在,小编曾经也花过不少时间找bug,但很遗憾,都没办法准确定位,无奈只能使用try...catch...进行容错处理,但这一次不一样,为了解决这个问题花了4、5天时间,一点点抽丝剥茧,最终功夫不负有心人,终于成功定位到bug点,实际多轮测试40线程合成700万字符超大文本无报错,看到这里是不是可以考虑给小编加个鸡腿

图片

,至于为什么测试40线程没问题给大家只开到20线程,主要还是为了确保稳定,稳定大于一切。

4、增加:设置界面微软APIkey选项保存到配置文件

图片

这个其实是之前的疏忽,没有将设置选项中的微软APIKEY选项值保存到配置文件,导致使用微软APIKEY的用户每次都运行程序都要去勾选,这次一并补上。

5、其它

其它都是一些零碎的优化,和前面这些相比,不值一提,就此略过。

最后

希望此次更新有大家期待的内容,enjoy~

相关下载

ZTJ-TTS-N 文本转语音工具

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

addi119

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值