GLM-4-Voice上手体验,端到端语音模型,语音合成,情感控制,语速控制

好久不见,昨天看到智谱AI推出了端到端的语音模型GLM-4-Voice,迫不及待的来部署体验下。

GLM-4-Voice 能够直接理解和生成中英文语音,进行实时语音对话,并且能够遵循用户的指令要求改变语音的情感、语调、语速、方言等属性。

用户可以输入语音或文本,模型会同时给出语音和文字回复。

效果

那先看看效果

我先让GLM-4-Voice朗读一段诗词

举头望明月

还不错,上点强度

粤菜

当然也可以说指定的文案

粤语指定

还尝试了东北话(但是不太明显)

东北话

除了可以说方言以外,GLM-4-Voice还支持语速控制、感情控制等。你只需要输入描述文字即可。这里我不过多演示。

使用

我们制作了Windows版本的整合包,原本想Mac版本也出一个,但是看到占用显存很大,直接放弃。

整合包目录下有两个exe

先点击启动服务

启动成功后,这个窗口不要关闭,双击启动webui.exe

进入程序界面

在这里输入你的文本,点击提交

成功生成,需要注意的是,生成时音频时流式传输,会一部分一部分的进行播放,全部生成完毕后会显示完整的音频。

本地部署中遇到的问题

这部分是自己部署时遇到的一些问题总结。如果你是用的整合包,可以忽略这部分内容。

ERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (pynini)

这是由于pip编译pynini失败导致的。用conda安装

conda install -c conda-forge openfst
conda install -c conda-forge pynini==2.1.5

默认gradio不显示音频问题

降低gradio版本

pip install gradio==4.44.1

ModuleNotFoundError: No module named 'matcha.models'; 'matcha' is not a package

依赖文件中少写了matcha相关的

pip install matcha-tts

端口号问题

/generate_stream (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7fd6219fe680>: Failed to establish a new connection: [Errno 111] Connection refused'))

由于端口号该项目默认是固定的10000,我执行的时候会显示端口号被占用。

修改model_server.py脚本中的第111行

parser.add_argument("--port", type=int, default=8927)

修改web_demo.py脚本中106行

 with torch.no_grad():
            response = requests.post(
                "http://localhost:8927/generate_stream",
                data=json.dumps({
                    "prompt": inputs,
                    "temperature": temperature,
                    "top_p": top_p,
                    "max_new_tokens": max_new_token,
                }),
                stream=True
            )

配置要求

windows GPU占用22G左右。还是非常吃配置的

配置不够的朋友,可以用云端来体验下。

仙宫云体验

仙宫云 | GPU 算力租赁 | Xiangongyun.com

魔塔云端体验

魔搭社区

整合包获取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

关注公众号,发送【GLM-4-Voice】关键字获取整合包。

如果发了关键词没回复你!记得看下复制的时候是不是把空格给粘贴进去了!

### 解决 Python 中 `ModuleNotFoundError: No module named 'matcha'` 的方法 当遇到 `ModuleNotFoundError: No module named 'matcha'` 错误时,这通常意味着 Python 无法在默认的模块搜索路径中找到名为 `matcha` 的模块。以下是几种解决方案: #### 使用 `try-except` 安全导入并提示安装 为了优雅处理这种情况,可以在尝试导入模块之前使用 `try-except` 结构来捕获异常,并向用户提供有用的反馈或提供替代方案。 ```python try: import matcha except ModuleNotFoundError as e: print("Matcha module not found. Please ensure it's installed.") ``` 此代码片段展示了如何通过捕捉 `ModuleNotFoundError` 来防止程序崩溃,并给用户友好的提醒[^1]。 #### 添加自定义路径至 `sys.path` 如果 `matcha` 是本地开发中的私有库或者是位于特定位置的一个文件夹,则可以通过修改 `sys.path` 将其所在的位置加入到 Python 查找模块的地方。 ```python import os import sys # 获取当前脚本所在的目录,并构建相对于该位置的目标包路径 parent_dir = os.path.abspath(os.path.join(os.getcwd(), '..')) sys.path.insert(0, parent_dir) # 现在应该可以从这里成功引入 Matcha 模块了 import matcha ``` 这段代码动态调整了系统的模块查找路径,使得即使不在标准环境中也能访问指定名称的空间内的资源[^3]。 #### 验证环境配置与依赖项管理工具设置 确认工作区已经正确设置了虚拟环境(如果有),并且所有必要的第三方库都已经被 pip 或其他类似的软件包管理系统所安装。对于大多数公共可用的 Python 库来说,在命令行运行如下指令即可完成安装: ```bash pip install matcha ``` 确保使用的 Pip 版本是最新的,并且针对的是正确的 Python 解释器版本。另外也要注意检查项目的 setup.py 文件或其他形式的依赖声明文档,看是否有遗漏未被添加进去的关键组件列表[^2]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值