# GTP-SoVITS语音训练合成测试-20240430

GTP-SoVITS语音训练合成测试-20240430


https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e/tkemqe8vzhadfpeu

https://github.com/RVC-Boss/GPT-SoVITS?tab=readme-ov-file

https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official

1 机器配置

基于( NVIDIA 4090[24G] + 16CPU + 120G内存 )的 1、2、8 倍服务器配置及新款高性能 NVIDIA L20[48G] + 20CPU + 100G内存服务器四种环境下的测试

  • A

    image-20240430161946499B

  • B

    image-20240430162115297

  • C

    image-20240430162137037

  • D

    image-20240430162205937

2 测试文本

  • 录音文本(50字):就在小马准备过河的时候,从树上跳下的松鼠却阻拦说:河水“深得很哩!昨天,我的一个伙伴就是掉在这条河里淹死的”。

  • 合成语音用文本(200字):一天,一只猴子在河边骑车。这时他看见树下有一只狮子,狮子向他跑来。他非常的害怕,掉进河里。他不会游泳,大叫起来。兔子听见了,跳进水里,但他却没有办法救猴子。幸运的是,一只大象过来了。大象非常强壮,救出了兔子和猴子。他们来到大象的家,在那里吃了一顿大餐。从此他们成了好朋友。

3 测试结果

配置声音文件0a0b0c1A1B训练合计合成备注
A
(4090+16c+120g) x 1
17416248013117
27415248213219
B
(4090+16c+120g) x 2
15313266611324
25313276511319
C
(4090+16c+120g) x 8
153131048821321
253131048420920
D
(L20+20c+100g) x 1
15213206210221
25213206110119

表格单位:秒

4 结论

  1. 50个字的训练语音质量OK
  2. 最佳显卡数量为2,最佳成本显卡数量为1,太多显卡并不能提高训练速度,反而会更慢
  3. 高性能服务器的确能提高效率,L20单卡比4090双卡效率更高
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值