GTP-SoVITS语音训练合成测试-20240430
https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/tkemqe8vzhadfpeu
https://github.com/RVC-Boss/GPT-SoVITS?tab=readme-ov-file
https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official
1 机器配置
基于( NVIDIA 4090[24G] + 16CPU + 120G内存 )的 1、2、8 倍服务器配置及新款高性能 NVIDIA L20[48G] + 20CPU + 100G内存服务器四种环境下的测试
-
A
B
-
B
-
C
-
D
2 测试文本
-
录音文本(50字):
就在小马准备过河的时候,从树上跳下的松鼠却阻拦说:河水“深得很哩!昨天,我的一个伙伴就是掉在这条河里淹死的”。
-
合成语音用文本(200字):
一天,一只猴子在河边骑车。这时他看见树下有一只狮子,狮子向他跑来。他非常的害怕,掉进河里。他不会游泳,大叫起来。兔子听见了,跳进水里,但他却没有办法救猴子。幸运的是,一只大象过来了。大象非常强壮,救出了兔子和猴子。他们来到大象的家,在那里吃了一顿大餐。从此他们成了好朋友。
3 测试结果
配置 | 声音文件 | 0a | 0b | 0c | 1A | 1B | 训练合计 | 合成 | 备注 |
---|---|---|---|---|---|---|---|---|---|
A (4090+16c+120g) x 1 | 1 | 7 | 4 | 16 | 24 | 80 | 131 | 17 | |
2 | 7 | 4 | 15 | 24 | 82 | 132 | 19 | ||
B (4090+16c+120g) x 2 | 1 | 5 | 3 | 13 | 26 | 66 | 113 | 24 | |
2 | 5 | 3 | 13 | 27 | 65 | 113 | 19 | ||
C (4090+16c+120g) x 8 | 1 | 5 | 3 | 13 | 104 | 88 | 213 | 21 | |
2 | 5 | 3 | 13 | 104 | 84 | 209 | 20 | ||
D (L20+20c+100g) x 1 | 1 | 5 | 2 | 13 | 20 | 62 | 102 | 21 | |
2 | 5 | 2 | 13 | 20 | 61 | 101 | 19 |
表格单位:秒
4 结论
- 50个字的训练语音质量OK
- 最佳显卡数量为2,最佳成本显卡数量为1,太多显卡并不能提高训练速度,反而会更慢
- 高性能服务器的确能提高效率,L20单卡比4090双卡效率更高