小镇做题家——打造AI播客

本文分享了一位博主如何使用Python爬虫抓取古代文学资源,通过AI技术如Real-Time-Voice-Cloning实现个性化语音合成,并部署服务、进行结果提醒和自动推送的过程,全程记录了从创意到实践的开发经历。
摘要由CSDN通过智能技术生成

最近心血来潮,打算打造一个自己声音音色的播客
主要有这么几个模块:
1.素材爬虫
素材爬虫主要有这么几个问题,一个是版权问题,不是说网上所有的东西都能爬,而且都能够被我拿去播放的,因此这里打算先从古代的古诗古文,四大名著类开始
而如果说爬虫的话,主要利用的工具有如下几种:
request,bs4,pandas
2.语音合成
语音合成这里用到的主要是TTS技术,TTS技术笔者调研了网上目前已有的几种方案(TTS方案),但是感觉效果都比较一般,毕竟我想做的是克隆自己的声音,去用别的声音感觉就没有太大意思,于是我换了一个思路:
在网上检索了一个方案,20分钟克隆你的声音
如此甚好,这就是我要的东西,但是这样的一堆app,好像违背了我做一个极客程序员的初衷,要啥app,代码直接搞
AI声音模仿,5秒钟克隆你的语音
于是乎我就在b站上github上很火的5秒AI克隆声音官方教程 中字

在这里插入图片描述

看了如下的项目:Real-Time-Voice-Cloning
在这里插入图片描述
也知道了这项技术的标准黑话是:AI拟声
但是新的问题产生了,这个好像只支持英语,不过不要紧,先玩起来再说嘿嘿

于是乎就有了如下的东西:

3.服务部署
服务部署的意思是我要把这个功能部署在我的服务器上,然后可以每日自动运行

4.结果提醒
做好的内容肯定是要给我自己试听一遍才能给大家发布嘛

5.自动推送
自动推送就是发布到一些平台上去,做为自己IP的一种展示,目前支持自动程序化推送的平台接口有:
xxx
xxx
6.项目感悟
这个项目从idea产生,应该是2021年的9月1号,真正开始检索方案,动手做是在9月4号的上午11点半,那个时候我正坐在五道口购物中心门口的pageone里,听着音乐,悠然的抖着腿,享受从CICC暂时解放的快乐和暂时的轻松。
到今天2021年 月 日,做完了一个完整的项目,然后发布出来,我感觉自己获得了很多的快乐

持续更新中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

量化橙同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值