最新轻量级文本转语音，parler-tts模型部署

最新推荐文章于 2025-03-12 15:45:28 发布

置顶

杰说新技术

最新推荐文章于 2025-03-12 15:45:28 发布

阅读量1.4k

点赞数 27

文章标签： AIGC 人工智能

本文链接：https://blog.csdn.net/m0_71062934/article/details/141269876

版权

Parler-TTS是一个由 Hugging Face 推出的开源文本转语音的模型。

Parler-TTS能够根据文本提示生成高质量、自然听起来的语音，并且能够模仿特定说话者的风格，如性别、音调和说话风格等。

Parler-TTS的架构基于MusicGen，包含文本编码器、解码器和音频编解码器，通过集成文本描述和添加嵌入层优化了声音生成。

Parler-TTS发布了两个模型，一个是参数量为 880M的Mini模型，一个是参数量为 2.3B的Parler-TTS Large模型。

github项目地址：https://github.com/huggingface/parler-tts。

一、环境安装

1、python环境

建议安装python版本在3.10以上。

2、pip库安装

pip install git+https://github.com/huggingface/parler-tts.git

二、功能测试

1、运行测试：

（1）python代码调用测试

import torch
from parler_tts import ParlerTTSForConditionalGeneration
from transformers import AutoTokenizer
import soundfile as sf

device = "cuda:0" if torch.cuda.is_available() else "cpu"

model = ParlerTTSForConditionalGeneration.from_pretr

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

杰说新技术

关注关注

27
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

轻量化 TTS 模型近三年进展调研

agito_cheung的博客

02-18

199

以上进展和资源为近期轻量化 TTS 的核心方向，开发者可根据需求选择适合的模型和部署方案。

Parler-TTS 开源项目教程

gitblog_00826的博客

08-09

626

Parler-TTS 开源项目教程项目地址:https://gitcode.com/gh_mirrors/pa/parler-tts 1. 项目介绍 Parler-TTS 是一个轻量级的文本转语音（Text-to-Speech, TTS）模型，它能够以指定说话者的风格（如性别、音高、说话方式等）生成高质量且自然的语音。这个项目是Dan Lyth和Simon King在Stability AI 和...

参与评论您还未登录，请先登录后发表或查看评论

Parler-TTS ：一个完全开源的的高质量TTS模型

GDL_MPY的博客

10-09

772

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现，两位作者分别来自 Stability AI 和爱丁堡大学。

最新发布

SJJS_1的博客

03-12

5259

出门问问最新开源语音合成模型，具有超强语音合成能力

Nix-TTS: 轻量级端到端文本转语音的突破性技术

2401_87458718的博客

10-22

1057

Nix-TTS的出现标志着轻量级TTS技术的一个重要里程碑。通过创新的模块化知识蒸馏技术,Nix-TTS成功地将高质量TTS模型的能力压缩到了一个极小的体积中,同时保持了令人印象深刻的语音质量和推理速度。这一突破不仅拓展了TTS技术的应用范围,也为未来更多轻量级AI模型的发展提供了宝贵的经验和思路。

推荐开源项目：ttskit - 简易文本转语音工具

gitblog_00040的博客

04-10

939

屌炸的文本转语音AI——ChatTTS本地部署教程

vscene的博客

06-05

9961

一周20.2K星! 的文本转语音TTS模型 -- ChatTTS

高效语言模型 Parler-TTS 上线，一键完成文本转语音

XLionXxxx的博客

11-19

790

平台会自动选择合适的算力资源和镜像版本，这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像，根据需求选择「按量付费」或者「包日/周/月」，点击「审核并执行」。Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型，可以生成具有给定说话者风格的高质量、自然语音，自由度及创新性非常高，并且可以通过 Prompt 控制说话者的性别、音色、语调以及所处的场景（室内、室外、马路上、音乐厅等）。平台在克隆过程中已自动为我们配置好了模型文件，点击「下一步：选择算力」。

Parler-TTS 介绍

chinansa的博客

09-14

409

自主训练定制声音：如果你想根据自己的数据集对该模型进行训练和微调，以定制独特的声音，可以参考项目的官方文档以及相关的机器学习和深度学习知识，准备好自己的数据集，并按照模型的训练流程进行操作。灵活性高：支持自定义训练，用户可根据需求调整模型参数以适应特定的发音或语境，能够按照给定说话者的风格（如性别、音调、说话风格等）生成高质量、听起来自然的语音。完全开源：所有代码、数据集和权重都以许可方式公开，这为开发者提供了丰富的资源和极大的自由度，可以深入研究模型的原理和实现，也便于根据特定需求进行修改和优化。

llama.cpp如何部署模型parler-tts/parler_tts_mini_v0.1

10-24

Parler-TTS是一种文本转语音(TTS)模型，Mini版本可能是轻量级或者资源优化后的版本。要部署Parler-TTS/parler_tts_mini_v0.1模型，你需要按照以下步骤操作： 1. **下载模型**：首先从GitHub或其他官方仓库下载...

基于LLM+TTS+Lip-Sync的流式数字人的问答系统框架

m0_71062934的博客

06-03

3578

Parler-TTS开源项目指南及问题解决方案

gitblog_07668的博客

09-13

496

Parler-TTS开源项目指南及问题解决方案 parler-tts Inference and training library for high-quality TTS models. 项目地址: https://gitcod...

探索Parler-TTS：开源的高质量文本转语音模型

gitblog_00397的博客

08-09

1001

探索Parler-TTS：开源的高质量文本转语音模型项目地址:https://gitcode.com/gh_mirrors/pa/parler-tts 在人工智能的众多应用中，文本转语音（TTS）技术以其独特的魅力和实用性，正逐渐成为研究和开发的热点。今天，我们将深入探讨一个令人兴奋的开源项目——Parler-TTS，这是一个由Stability AI和Edinburgh University联...

记录PaddleSpeech线上运行+本地部署

2302_79614780的博客

11-17

2226

记录一下PaddleSpeech语音合成1.用ai studio线上运行2.win10部署到本地遇到的问题和解决方案。希望明天一切都好。

DeepSeek-VL2实战指南：一步步构建您自己的智能视觉问答系统！

SJJS_1的博客

02-07

3531

DeepSeek-VL2，这是一系列先进的大型混合专家 (MoE) 视觉语言模型，其显著改进了其前身 DeepSeek-VL。DeepSeek-VL2 在各种任务中都表现出卓越的能力，包括但不限于视觉问答、光学字符识别、文档/表格/图表理解和视觉基础。我们的模型系列由三个变体组成：DeepSeek-VL2-Tiny、DeepSeek-VL2-Small 和 DeepSeek-VL2，分别具有 1.0B、2.8B 和 4.5B 激活参数。

探索Parler-TTS：新一代开源文本转语音模型

gitblog_00004的博客

05-08

973

探索Parler-TTS：新一代开源文本转语音模型 parler-ttsInference and training library for high-quality TTS models.项目地址:https://gitcode.com/gh_mirrors/pa/parler-tts Parler-TTS，一个轻量级的文本转语音（TTS）工具，能够生成高质量、自然的声音，模仿特定说话者（性别...

Parler TTS: 更新 v1 轻量级文本转语音模型

weixin_51674085的博客

08-09

455

版本，分为了 885M（Mini）和 2.2B（Large）两个型号，速度更快了，音色更稳定了。之前发过，正儿八经的开源，包括数据集的那种，最近上新了。

ChatTTS 开源文本转语音模型本地部署、API使用和搭建WebUI界面（建议收藏）

2401_84204207的博客

06-11

7064

（Chat Text To Speech）是专为对话场景设计的文本生成语音(TTS)模型，特别适用于大型语言模型()助手的对话任务，以及诸如对话式音频和视频介绍等应用。同时，模型文件总大小左右，常用的个人笔记本电脑均可部署，因此涉及到文本转语音场景，均可以自己操作转换了！