fish speech 快速体验版
搭载了该项目所需要的所有环境和模型
windows下只能使用wsl运行此项目训练的训练,不过貌似不需要wsl也可以运行推理
目前项目正在快速发展中…未来可期喵
项目仓库:https://github.com/fishaudio/fish-speech
文档链接:https://speech.fish.audio/finetune/(必看)
镜像作者:bilibili@kiss丿冷鸟鸟
我放了一套 孙笑川 测试数据集在镜像里面,有需要的可以试试,不需要的话删了或者不管就是了
镜像使用手册(小白必看)
如果你的是长音频,则将长音频放入audio slicer内的input文件夹内,进行切割,然后就可以一路标注和预处理,训练了
如果你的是已经处理好的短音频片段,则将短音频放入标注文件夹,然后就可以进行标注,预处理,训练了
如果你既有标注,又有短音频片段,则将短音频放入workdir/fish-speech/data/demo-raw内,标注文件放入workdir/fish-spech,然后就可以预处理,训练了
镜像和文档内的操作有一点点不一样,不过不影响,大佬随意,小白还是建议跟着镜像走(
准备部分
#移动项目到数据盘节约空间
%mv /root/workdir/ /root/autodl-tmp/
#填入你的说话人名称
#在每次进入笔记本前请先运行一次这个代码块
speaker = “sunxiaochuan”
#创建文件夹
%mkdir /root/autodl-tmp/workdir/fish-speech/data/demo-raw/{speaker}
切割
#进入切割文件夹
%cd /root/autodl-tmp/workdir/audio-slicer/
#开始切割
!bash 切割,启动!.sh
#移动音频文件到标注文件夹
%mv output/*.wav …/auto-VITS-DataLabeling/raw_audio
标注
#进入标注文件夹
%cd /root/autodl-tmp/workdir/auto-VITS-DataLabeling
#对音频进行重命名
#在运行这步之前,请确保你已经在准备部分进行过一次说话人的修改
#重命名后的音频位于workdir/auto-vits-DataLabeling/raw_audio文件夹中
import subprocess
bash_script = f’‘’
#!/bin/bash
speaker=“{speaker}”
counter=1
for file in ./raw_audio/; do
if [ -f " f i l e " ] ; t h e n n e w n a