【关于AI 文字转语音和语音转文字的方法或服务】

这个时代，越来越多的技术正在丰富我们的读和听,好的技术会极大地方便我们的生活和学习，关于AI 文字转语音和语音转文字的方法或服务，这里针对性的给出介绍：（文章个人原创，转载需署名）

1.视频转文字

主要是保存有些自己下载好的视频的文字稿，自媒体学生，会议记录者-打工人&职员，初级开发者–会调用API即可。

1.1已经下载视频或者音频

可采用飞书妙记 免费2G
老版本的剪影软件支持配字幕可以导出字幕，免费，版本5.8及以前，就是这样啦 [微笑] ；
可以使用付费服务百度网盘-文稿服务需要svip,夸克网盘文稿服务;
其他，比如阿虚同学的本地语音转文字一键部署包，绑定鼠标右键，视频音频都好用，本地不联网可使用，错误率堪比付费的百度网盘，跑的是显卡服务；
buzz，GitHub有他的Windows安装包，高精度模型需要存储空间>3G;好处方便，且不用联网，方便部署，跑CPU计算，不需要独立显卡；下载安装包时，偶尔因为网络问题需要科学上网。
比较豪的，需要企业级服务的使用大厂的speech 服务，火山引擎百度云腾讯云阿里云。这些支持API服务

1.2 实时转换服务

手机自带的服务，著名的有小米闻声 vivo听见，免费的巨赞，巨赞。如果后期收费了，比如华子前期免费后期就收费了，那就下载以前的老版本，需要到酷安社区找；华子的在笔记软件中

小米 vivo 是独立的。并且苹果的本身就可以在没有网是，按录音键，实现实时的音频转文字，实测准确读不比讯飞内核的好多输入法在线结果差。
Windows 自己带有字幕功能，win11可用

参考 https://www.sysgeek.cn/windows-11-live-captions/

浏览器，阿里千问插件，edge浏览器，插件管理，搜索可见，他的插件名字，变过几次。不过看开发者是谁，就可以断定多数。
3. 大部分的盆友，可以搜索讯飞听见，这款软件，偶尔用下，救个急，不用怎么破费。好处准确，Android Apple Windows 都有。无需部署，下载就可以使用，体积小。

2.文字转音频

普通人，不想花钱的，截止2025年3月5日，有智能手机的朋友，
豆包，可以复刻自己的音色；
小米的超级小爱（普通小爱，自己找升级的安装包，提示，在绿色的聊天软件中搜索即可），可以复刻自己的音色。
搜索关键词 AI 文字转语音；

1.
https://ttsmaker.cn/
支持50+种全球语言300+语音包风格   无广告
2.https://texttospeech.online/
3 https://www.narakeet.com/app/text-to-audio/   相当逼真 
4.  https://app.clipchamp.com/  大厂微软 **相当猛，不花钱，选择多**

在这里插入图片描述
3 。有动手能力的盆友
对音质要求高，肯花钱，电脑配置给力（GPU》4G，内存》=16G），符合条件之一的，可选择
cozyvoice 阿里大厂开源，支持3s声音复刻
gpt_voice 花儿不哭大佬包装的一键部署包
chat_ttsGitHub有开源模型，不过最好使用第三方优化的部署包，原作者为了防止技术滥用，故意在模型训练时加了噪声，这是支持情绪控制的一个AI文字转音频
智灵AI算力平台阿里云平台都有提供 cozyvoice的方便实用的，音质支持定制的物美价廉的服务，火山引擎也有，钱多的大佬可以买他的服务。
4.开发者
海螺AI文字转音频-支持web服务支持 API