AI声音克隆模型常见问题汇总笔记(附解决方法,可评论区留言问题技术交流

AI声音克隆模型常见问题汇总-学习笔记(附解决方法

声明:
源码非原创,转载自小破站UP主Jack-Cui,文章部分内容来源网路,本文只用于技术分享,模型训练与语音输出已测试成功。

硬件配置工具及运行环境

CPU: i5-12490F
显卡:七彩虹战斧 RTX 4060 显存8G  # 网传:A卡不行
内存:16G
运行系统:Windows 10
Python版本:3.10.9
Python旧版本下载链接:https://www.python.org/downloads/windows/

名词解释:

batch_size:计算效率和内存容量之间的平衡参数。若为高性能GPU,可以设置更大的batch_size值
epochs:所有样本训练一遍。一个epoch是所有训练样本的一轮正向传递和一轮反向传递。
举例:假设训练数据集总共有1000个数据集,batch_size=10,样本集需要100次迭代,完成1次epoch。


*问题汇总(附解决方法

Part 1: 训练几小时报错。

解决方法:比如设置了epoch为50,结果训练很久后报错,可以看cmd的日志,是不是最后一条训练Epoch为50或者51.这种报错是模型训练已经完成。直接关闭,启动 预测一键启动.bat 即可


Part 2:CUDA相关报错

在这里插入图片描述
解决方法:这种一般是爆显存,建议是音频做下切片,每个wav不超过2分钟,batch_size调小一下。


Part 3: Error Connection errored out.

在这里插入图片描述
解决方法:打开报错:Error Connection errored out. 建议检查下代理服务器有没有关掉,以及墙/VN/魔法上网,有没有关闭。


Part 4: 找不到系统指定路径问题

解决方法:一般这个是权限不够,直接双击,或者用管理员身份打开。如果是预测一键启动.bat打不开,也有可能是模型没有训练成功。


Part 5:开始运行后提示:音频文件识别失败

解决方法:这个是训练填写的路径错误,路径不要包含中文,建议是直接在工程文件里面找到VITS_fast_finetune\raw_audio直接复制粘贴过去


Part 6:页面文件太小,无法完成操作

解决方法:这个需要修改下虚拟内存。建议改大一点。具体教程可以百度搜索
大概步骤:高级系统设置–点上边高级–性能里面点设置–再点性能选项中高级–出来有个虚拟内存更改按钮–点击进去设置(根据自己硬件条件设置,比如D盘256G 我设置100G虚拟内存


Part 7:bat 文件乱码

解决方法:不要使用win11默认的解压软件,解压压缩包,请使用WinRAR解压。

解压工具分享链接:https://pan.baidu.com/s/10QEYoeNoUem9hCkWzzQpaw
提取码:9996


Part 8: ProcessExitedException 报错 code 3221225477

process 0 terminated with exit code 3221225477
在这里插入图片描述
解决方法:报错原因是音频通过脚本生成对应的text文本中,句子太长。简而言之还是爆显存
个人解决方法:将wav文件做下前期处理,通过剪映将长句子的片段裁剪掉
Up主解决方法https://www.bilibili.com/video/BV13z4y1L74i/ 视频4分钟后就有讲解该问题。


Part 9:训练没有进度条,空跑项目

在这里插入图片描述
解决方法:检查音频raw_audio文件夹有没有放到VITS_fast_finetune 工程目录下


Part 10:运行后网页打不开

在这里插入图片描述
解决方法:打开 finetune_webui.py 文件,修改最后两行代码,8088 改为 8089 或者其他端口。


Part 11:multiprocessing.spawn.ProcessExitedException: process 0 terminated with exit code 1

在这里插入图片描述
解决方法:这种异常报错,直接打开 finetune_webui.py 文件,找到587行,将gr.Slider中第二个参数改成 10000,重新运行代码,在网页端选择epochs时,调高点。

max_epochs = gr.Slider(2, 10000, value = 200, label = "训练epochs次数", info = "迭代训练的轮次,默认200")

Part 12:路径没错,点开始训练完全没反应,也没打印流程

在这里插入图片描述
解决方法:检查,检查,检查路径中的音频文件后缀是不是小写wav,文件后缀必须为小写!小写!小写的wav


Part 13: UnicodeEncodeError: ‘gbk‘ codec can‘t encode character(编码问题

解决方法:更新一下 pip,

更新指令:pip install --upgrade pip
然后win+R 输入cmd,输入
set PYTHONUTF8=1


Part 14:关于预测一键启动.bat 运行失败问题

解决方法:检查路径中是否含有中文,需要先运行训练一键启动.bat,训练好模型之后,关掉训练一键启动.bat,只运行预测一键启动.bat,模型是不能分享,必须自己训练。


Part 15:关于重新训练模型

解决方法:分别删除以下 目录 里面的文件

denoised_audio
custom_character_voice
separated
segmented_character_voice
OUTPUT_MODEL

然后删除工程目录下的 txt 文件

final_annotation_train.txt
final_annotation_val.txt

另外:如果想继续之前训练一般的模型,OUTPUT_MODEL目录的文件不用删除,仅删除上面所述的其他文件。重新运行代码即可


Part 16:(待更新,可以在评论区留言…

有待更新…


个人使用总结:

1.音频文件尽量是5分钟内
2.效果与预期可能有点差距,只能到百分之80-90的效果
3.训练的时间需要很长。建议先设置epochs=50试一下,是不是自己想要的效果,不满意建议就换音源节省时间,个人测试后epochs=900与epochs=50 只是音质完善一下。
4.训练模型中,最好使用干声作为数据源
5.使用工具链接分享

哔哩哔哩视频解析下载:https://bilibili.iiilab.com/
在线视频提取音频:https://airmore.cn/extract-audio-online
在线转换音频文件:https://www.aconvert.com/cn/audio/


创作不易,麻烦点个赞!感谢支持!!

创作不易,麻烦点个赞!感谢支持!!

创作不易,麻烦点个赞!感谢支持!!

  • 34
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
【完整课程列表】 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第1章 关于AI人工智能 About AI 共79页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第3章 状态空间搜索的结构与策略 共58页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第4章 启发式搜索 Heuristic Search 共57页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第5章 随机方法 Stochastic Methods 共41页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第6章 楼宇控制算法 BuildingControlAlgorithms 共48页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第7章 知识表示 KnowledgeRepresentation 共80页.ppt 中山大学 超级计算机学院 Ai人工智能课程 AI课程 第8章 强方法解决问题 StrongMethodProblemSolving 共53页.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2015课堂练习3 习题question.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习1 答案answer.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习1 习题question.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习2 习题question.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习4 习题question.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习6 ProductionSystem 习题.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习6 答案answer.ppt 中山大学 超级计算机学院 AI人工智能课程 AI课程 AI2016课堂练习7 KnowledgeRepresentation 习题.ppt

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

PG万般

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值