使用iOS个人声音与SoVITS训练个人AI语音（10分钟快速上手）

猪萌萌

于 2025-02-18 16:26:51 发布

阅读量1.5k

点赞数 19

分类专栏：个人博客转载文章标签： ios 人工智能 SoVITS TTS 文字转语音

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46419890/article/details/145708880

版权

使用iOS个人声音与SoVITS训练个人AI语音（10分钟快速上手）

在这里插入图片描述

序言：最近在抖音上频繁看到曼波唱歌的视频和各种AI语音的搞笑短片，加上年后新购置的M2硬盘终于提供了足够的存储空间，让我有机会深入研究AI语音训练。24年年初我就想进行AI语音训练，但苦于语音素材难以获取，这次有了iOS收集素材就方便多了。在公司闲暇时，我摆弄着自己的iPhone 12，偶然发现了“个人声音”这一新功能，它允许用户在手机上训练一个基础的AI模型。我意识到可以将自己录制的150条语音导出，并通过查阅资料了解到可以利用SoVITS进行语音模型训练。因此，我撰写这篇教程，旨在记录并指导大家如何使用iOS手机收集语音素材，并利用SoVITS训练出属于自己的AI语音。

一、介绍

iOS 17引入的“个人声音”功能：允许用户通过录制一系列短语生成自定义语音，适用于语音助手、朗读文本等场景，特别适合有语言障碍的用户。该功能需在iOS 17及以上版本使用，注重隐私保护，所有数据处理均在设备本地完成。

GPT-SoVITS：由花儿不哭开发，是一款低成本AI音色克隆软件，目前支持TTS（文字转语音）功能，未来将支持变声功能。请注意，GPT-SoVITS的正确缩写是GSV，不要与So-VITS-SVC混淆。

PyCharm：JetBrains开发的Python IDE，提供代码编辑、调试等功能，支持跨平台使用，有免费社区版和付费专业版

二、训练准备

2.1 语音素材准备/导出

打开设置 -> 辅助功能 -> 个人声音。
如果没有个人声音，选择新建并按照系统指引录制素材。
录制完成后，点击导出录音，将压缩包复制到电脑。

在这里插入图片描述

2.2 下载GPT-SoVITS

点击此处，选择合适的方式进行下载。

三、开始训练

3.1 离线批量ASR

将导出的语音包解压到电脑（如Z:\sovit-data-mother\TrainingData）。
运行GPT-SoVITS-v2-240821中的go-webui.bat启动SoVITS。
在Web页面中找到“离线批量ASR”模块，输入语音包路径（如Z:\sovit-data-mother\TrainingData）和输出路径（如Z:\sovit-data-mother\TrainingData\out\asr_opt）。
点击“开始离线批量ASR”，等待任务完成。

在这里插入图片描述

当出现"ASR任务完成,查看终端进行下一步"时,ASR步骤结束。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猪萌萌 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。