今天上午第一次了解了github的trending功能,以后可以有兴趣复现一些有意思的项目了。
首先尝试了对于mockingbird项目的简单复现。
一开始readme部分就给我干懵了,介绍贼长,后来搜了一下发现这是一种区别于windows特别的环境,所以我不用管它。
接着第二部分准备预训练模型又没搞清楚。为什么又有encoder,又有合成器,又是训练声码器。之前风格转换只需要一个模型就可以,这里怎么有三个,从Bilibili上看了下教学视频后才明白就是需要三个模型。这也算是普及知识吧。
接着就是配环境了,在刚开始学习写代码的时候,应该是2022年6、7月份的时候遇见了一个bug。当时就没解决,记得安装了紫色版本的VS但是不管用,而且卸载还麻烦。这一次又遇见了,按照下面这位作者的方式得到了解决。如果说比上次有什么经验的话就是这个还是安装在C盘,上次安装在D盘总是会报一些错误,而当时又没有解决bug的能力。
安装过程中还出现了版本过高导致的其他包不支持的情况,这也是第一次遇上。这也就是用anaconda配环境的意义吧。
https://blog.csdn.net/yuan2019035055/article/details/126934308?spm=1001.2014.3001.5506
下午百度云下载后发现输入有问题,无论是提前录制好的还是直接用mockingbird自带的窗口record的都效果极差,需要后续再调整一下。发现竟然用电脑或者JBL耳机录音听到的音质很差,和平常在wechat上听到的完全不同。考虑到可能是因为我背景噪音太大了,于是去网上下了别人声音清晰的录音,结果跑出来还是电流声。在项目的issue里面找了一下,发现可能是模型的问题,毕竟里面都报错了好像参数超出了。明天再下一个模型看看是不是可以。
另外发现我电脑上有两个anaconda,一个是mini一个是正常,但cmd却只能识别一个base,倒是也没必要debug,后面我肯定不用原版anaconda了,就删除了它就好了,后面用mini,自己安装包就行了。
又是debug的一天。