小镇做题家——打造AI播客_ai播客创作-CSDN博客

本文链接：https://blog.csdn.net/m0_37876745/article/details/120097889

本文分享了一位博主如何使用Python爬虫抓取古代文学资源，通过AI技术如Real-Time-Voice-Cloning实现个性化语音合成，并部署服务、进行结果提醒和自动推送的过程，全程记录了从创意到实践的开发经历。

摘要由CSDN通过智能技术生成

最近心血来潮，打算打造一个自己声音音色的播客
主要有这么几个模块：
1.素材爬虫
素材爬虫主要有这么几个问题，一个是版权问题，不是说网上所有的东西都能爬，而且都能够被我拿去播放的，因此这里打算先从古代的古诗古文，四大名著类开始
而如果说爬虫的话，主要利用的工具有如下几种：
request，bs4，pandas
2.语音合成
语音合成这里用到的主要是TTS技术，TTS技术笔者调研了网上目前已有的几种方案（TTS方案），但是感觉效果都比较一般，毕竟我想做的是克隆自己的声音，去用别的声音感觉就没有太大意思，于是我换了一个思路:
在网上检索了一个方案，20分钟克隆你的声音
如此甚好，这就是我要的东西，但是这样的一堆app，好像违背了我做一个极客程序员的初衷，要啥app，代码直接搞
AI声音模仿，5秒钟克隆你的语音
于是乎我就在b站上github上很火的5秒AI克隆声音官方教程中字

在这里插入图片描述

看了如下的项目：Real-Time-Voice-Cloning
在这里插入图片描述
也知道了这项技术的标准黑话是：AI拟声
但是新的问题产生了，这个好像只支持英语，不过不要紧，先玩起来再说嘿嘿

于是乎就有了如下的东西：

3.服务部署
服务部署的意思是我要把这个功能部署在我的服务器上，然后可以每日自动运行

4.结果提醒
做好的内容肯定是要给我自己试听一遍才能给大家发布嘛

5.自动推送
自动推送就是发布到一些平台上去，做为自己IP的一种展示，目前支持自动程序化推送的平台接口有：
xxx
xxx
6.项目感悟
这个项目从idea产生，应该是2021年的9月1号，真正开始检索方案，动手做是在9月4号的上午11点半，那个时候我正坐在五道口购物中心门口的pageone里，听着音乐，悠然的抖着腿，享受从CICC暂时解放的快乐和暂时的轻松。
到今天2021年月日，做完了一个完整的项目，然后发布出来，我感觉自己获得了很多的快乐

持续更新中