- 博客(3)
- 收藏
- 关注
原创 马赛克增强技术整理(Mosaic)
数据增强的作用主要是为了缓解过拟合现象。另外在工业故障检测的场景中,由于故障样本本来就比较少,这时候我们也可以使用数据增强。数据增强主要是在模型训练过程中,对数据样本进行一些操作,实现输出图像的多样化。需要注意如果图像超出马赛克画布的话需要对图像进行裁剪,bbox也是同理。2.抽选4张图片进行拼接分别对应左上右上左下右下四个部分。1.第一步首先生成马赛克画布。3.bbox进行坐标变化。
2024-08-20 17:19:45 85
原创 修改FishSpeech的webui.py直接运行,以及对新版本vit的一些疑惑
另外发现如果不训练直接推理使用vit,声音有点二次元的味道(目前我复现感觉是这样),并且有时候会出现女生变男生(可能是参数没调好?),感觉还是vqgan更接近于正常人的声音,我猜测是训练的数据集使用了大量的虚拟人物的声音(原神什么的叭)。如果需要换decoder模型记得修改权重路径,这里我用的就是vqgan。项目需要音色克隆,修改webui.py直接运行。上述两个修改分别对应权重和配置文件。主要是注释掉build_app()
2024-07-16 16:17:45 246
原创 GPT-Sovits修改网页版训练变成直接运行py
做项目拿到了GPT-sovits的网页版代码,项目要求改成接口后面开发人员拿到能直接调用于是修改。也就是直接调用生成函数,把with部分注释掉,这样可以直接不经过网页版运行py文件。另外修改GPT_SoVITS/inference_webui.py。这一步主要是传入两个训练好的权重。同样注释掉with并加入如下代码。
2024-07-03 09:46:11 350 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人