一、发明背景 当前声音克隆技术的成本较高,例如,原有技术的成本大约为500美元。 这种高成本限制了声音克隆技术的广泛应用和商业化潜力。 二、发明的新颖性 描述基于对等节点结构的声音克隆集群,每个节点都能提供训练和推理服务。 强调前端处理流程的优化,通过拆分文字内容,显著降低GPU占用。 提出将部分模型,如BERT特征模型,放在CPU上运行的策略。 引入预生成方式,将模型完全放在CPU上运行,并根据需求部署和卸载