🎤 Fish Speech:高效的低显存语音克隆工具,媲美GPT-SoVITS!
Fish Speech是一款创新的文本转语音(TTS)工具,它提供了极高的自定义性和灵活性,以满足用户的个性化需求。该工具采用了为处理大规模数据而设计的Flash-Attn算法,该算法以其高效性、准确性和稳定性著称,显著提升了TTS技术的性能。
Fish Speech的一个显著特点是其无需繁琐训练的能力,用户只需提供一段参考语音,便可迅速进行语音克隆。此外,该工具对显存的需求极低,仅需4GB,且具有快速的推理速度,极大地优化了用户体验。
学术Fun已经将Fish Speech打包成一键启动程序,极大地简化了使用流程,并避免了配置Python环境可能出现的问题。感兴趣的用户可以通过以下链接进行下载:🎤 Fish Speech:高效的低显存语音克隆工具,媲美GPT-SoVITS!_学术FUN,请在页面右侧区域点击下载。
请确保您的电脑配置符合以下要求:
-
操作系统:Windows 10/11 64位
-
显卡:拥有至少4GB显存的英伟达显卡
📦 下载及使用指南
下载软件
请访问以下链接进行下载:🎤 Fish Speech:高效的低显存语音克隆工具,媲美GPT-SoVITS!_学术FUN,并点击页面右侧的下载按钮。
解压及启动程序
-
解压所下载的压缩包,注意避免解压到包含中文的路径。
-
解压完成后,如下图所示,双击
启动.exe
以启动程序。
通过浏览器访问
-
打开您的浏览器并输入 http://127.0.0.1:7860/,即可开始使用Fish Speech。
准备参考音频文件
-
将您希望克隆的音频文件放置在
参考音频
文件夹中。确保音频文件的清晰度,以便获得最佳的克隆效果。
各位新老朋友,麻烦点个赞👍和在看👀吧!