自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 马赛克增强技术整理(Mosaic)

数据增强的作用主要是为了缓解过拟合现象。另外在工业故障检测的场景中,由于故障样本本来就比较少,这时候我们也可以使用数据增强。数据增强主要是在模型训练过程中,对数据样本进行一些操作,实现输出图像的多样化。需要注意如果图像超出马赛克画布的话需要对图像进行裁剪,bbox也是同理。2.抽选4张图片进行拼接分别对应左上右上左下右下四个部分。1.第一步首先生成马赛克画布。3.bbox进行坐标变化。

2024-08-20 17:19:45 85

原创 修改FishSpeech的webui.py直接运行,以及对新版本vit的一些疑惑

另外发现如果不训练直接推理使用vit,声音有点二次元的味道(目前我复现感觉是这样),并且有时候会出现女生变男生(可能是参数没调好?),感觉还是vqgan更接近于正常人的声音,我猜测是训练的数据集使用了大量的虚拟人物的声音(原神什么的叭)。如果需要换decoder模型记得修改权重路径,这里我用的就是vqgan。项目需要音色克隆,修改webui.py直接运行。上述两个修改分别对应权重和配置文件。主要是注释掉build_app()

2024-07-16 16:17:45 246

原创 GPT-Sovits修改网页版训练变成直接运行py

做项目拿到了GPT-sovits的网页版代码,项目要求改成接口后面开发人员拿到能直接调用于是修改。也就是直接调用生成函数,把with部分注释掉,这样可以直接不经过网页版运行py文件。另外修改GPT_SoVITS/inference_webui.py。这一步主要是传入两个训练好的权重。同样注释掉with并加入如下代码。

2024-07-03 09:46:11 350 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除