这个时代,越来越多的技术正在丰富我们的读和听
,好的技术会极大地方便我们的生活和学习,关于AI 文字转语音 和语音转文字的方法或服务,这里针对性的给出介绍:(文章个人原创,转载需署名)
1.视频转文字
主要是保存有些自己下载好的视频的文字稿,自媒体 学生,会议记录者-打工人&职员,初级开发者–会调用API即可。
1.1已经下载视频或者音频
- 可采用飞书妙记 免费2G
- 老版本的剪影软件支持配字幕可以导出字幕,免费,版本5.8及以前,就是这样啦 [微笑] ;
- 可以使用付费服务 百度网盘-文稿服务 需要svip,夸克网盘文稿服务;
- 其他,比如
阿虚同学的本地语音转文字一键部署包
,绑定鼠标右键,视频音频都好用,本地不联网可使用,错误率堪比付费的百度网盘,跑的是显卡服务; - buzz,GitHub有他的Windows安装包,高精度模型需要存储空间>3G;好处方便,且不用联网,方便部署,跑CPU计算,不需要独立显卡;下载安装包时,偶尔因为网络问题需要科学上网。
- 比较豪的,需要企业级服务的使用大厂的speech 服务,火山引擎 百度云 腾讯云 阿里云。这些支持API服务
1.2 实时转换服务
-
手机自带的服务,著名的有 小米闻声 vivo听见,免费的巨赞,巨赞。如果后期收费了,比如华子前期免费后期就收费了,那就下载以前的老版本,需要到酷安社区找;华子的在笔记软件中
小米 vivo 是独立的。并且苹果的本身就可以在没有网是,按录音键,实现实时的音频转文字,实测准确读不比讯飞内核的好多输入法在线结果差。
-
Windows 自己带有字幕功能,win11可用
参考 https://www.sysgeek.cn/windows-11-live-captions/
浏览器,阿里千问插件,edge浏览器,插件管理,搜索可见,他的插件名字,变过几次。不过看开发者是谁,就可以断定多数。
3. 大部分的盆友,可以搜索讯飞听见,这款软件,偶尔用下,救个急,不用怎么破费。好处准确,Android Apple Windows 都有。无需部署,下载就可以使用,体积小。
2.文字转音频
- 普通人,不想花钱的,截止2025年3月5日,有智能手机的朋友,
豆包
,可以复刻自己的音色;
小米的超级小爱
(普通小爱,自己找升级的安装包,提示,在绿色的聊天软件中搜索即可),可以复刻自己的音色。 - 搜索关键词 AI 文字转语音;
1.
https://ttsmaker.cn/
支持50+种全球语言300+语音包风格 无广告
2.https://texttospeech.online/
3 https://www.narakeet.com/app/text-to-audio/ 相当逼真
4. https://app.clipchamp.com/ 大厂微软 **相当猛,不花钱,选择多**
3 。 有动手能力的盆友
对音质要求高,肯花钱,电脑配置给力(GPU》4G,内存》=16G),符合条件之一的,可选择
cozyvoice 阿里大厂开源,支持3s声音复刻
gpt_voice 花儿不哭大佬包装的一键部署包
chat_ttsGitHub有开源模型,不过最好使用第三方优化的部署包,原作者为了防止技术滥用,故意在模型训练时 加了噪声,这是支持情绪控制的一个AI文字转音频
智灵AI算力平台 阿里云平台都有提供 cozyvoice的方便实用的,音质支持定制的物美价廉的服务,火山引擎也有,钱多的大佬可以买他的服务。
4.开发者
海螺AI文字转音频-支持web服务 支持 API
dubbingx 文字转音频-支持web服务 支持 API
还有
高度定制化,需要富强网络。
喜欢就点个赞吧,爱你的devang