最近心血来潮,打算打造一个自己声音音色的播客
主要有这么几个模块:
1.素材爬虫
素材爬虫主要有这么几个问题,一个是版权问题,不是说网上所有的东西都能爬,而且都能够被我拿去播放的,因此这里打算先从古代的古诗古文,四大名著类开始
而如果说爬虫的话,主要利用的工具有如下几种:
request,bs4,pandas
2.语音合成
语音合成这里用到的主要是TTS技术,TTS技术笔者调研了网上目前已有的几种方案(TTS方案),但是感觉效果都比较一般,毕竟我想做的是克隆自己的声音,去用别的声音感觉就没有太大意思,于是我换了一个思路:
在网上检索了一个方案,20分钟克隆你的声音
如此甚好,这就是我要的东西,但是这样的一堆app,好像违背了我做一个极客程序员的初衷,要啥app,代码直接搞
AI声音模仿,5秒钟克隆你的语音
于是乎我就在b站上github上很火的5秒AI克隆声音官方教程 中字
看了如下的项目:Real-Time-Voice-Cloning
也知道了这项技术的标准黑话是:AI拟声
但是新的问题产生了,这个好像只支持英语,不过不要紧,先玩起来再说嘿嘿
于是乎就有了如下的东西:
3.服务部署
服务部署的意思是我要把这个功能部署在我的服务器上,然后可以每日自动运行
4.结果提醒
做好的内容肯定是要给我自己试听一遍才能给大家发布嘛
5.自动推送
自动推送就是发布到一些平台上去,做为自己IP的一种展示,目前支持自动程序化推送的平台接口有:
xxx
xxx
6.项目感悟
这个项目从idea产生,应该是2021年的9月1号,真正开始检索方案,动手做是在9月4号的上午11点半,那个时候我正坐在五道口购物中心门口的pageone里,听着音乐,悠然的抖着腿,享受从CICC暂时解放的快乐和暂时的轻松。
到今天2021年 月 日,做完了一个完整的项目,然后发布出来,我感觉自己获得了很多的快乐
持续更新中