【首个开源数字人】HeyGem—— Heygen的开源替代方案，从此克隆数字人不再有门槛！

HeyGem

已于 2025-04-23 18:10:33 修改

阅读量892

点赞数 4

于 2025-04-23 17:52:20 首次发布

本文链接：https://blog.csdn.net/2509_91795814/article/details/147458196

版权

Heygem是一款专为Windows系统设计的全离线视频合成工具，它能够精确克隆您的外貌和声音，让您的形象数字化。您可以通过文字和语音驱动虚拟形象，进行视频制作。无需联网，保护隐私的同时，也能享受到便捷和高效的数字体验。

HeyGem数字人效果实测对比

01 网站入口

Github项目地址：

https://github.com/GuijiAI/HeyGem.ai

本地部署流程：

https://mp.weixin.qq.com/s/IZvATAEKd_KtzHwFmHDA-w?from=industrynews

问题反馈渠道：

https://github.com/GuijiAI/HeyGem.ai/issues

Heygem - 魔乐社区版 (解决镜像拉取问题)：

https://modelers.cn/models/Modelers_Park/HeyGem.ai

02 它的功能到底有多强？

全离线操作：无需联网即可使用，有效保护用户隐私，让用户在安全、独立的环境中进行创作，避免数据在网络传输过程中可能存在的泄露风险。

简单易用：操作界面简洁直观，即使是没有任何技术背景的小白也能轻松上手，快速掌握软件的使用方法，轻松开启数字人创作之旅。

多模型支持：支持导入多个模型，并通过一键启动包进行管理，方便用户根据不同的创作需求和应用场景选择合适的模型。

03 如何去安装？

一、前置条件

必须有 D 盘：主要用于后续数字人、作品等数据存储

空闲空间要求：大于30G
C 盘：用于存储服务镜像文件

空闲空间要求：大于 100G
系统要求：

目前支持 Windows 10 19042.1526 或更高版本
推荐配置：

CPU：第13代英特尔酷睿 i5-13400F

内存：32G及以上（必要）

显卡：RTX4070

显存：12G以上
确保有英伟达显卡，并正确安装显卡驱动（必要）
英伟达驱动下载地址：

https://www.nvidia.cn/drivers/lookup/

二、安装 Windows Docker

用wsl --list --verbose命令可以查看本机有没有安装过wsl，如下图就是已经安装过，无需再安装

安装wsl的命令：wsl --install

由于网络原因，可能失败，多试几次

安装过程中需要设置新的用户名和密码，设置并记住

2.用wsl --update更新wsl。

下载 Docker Windows 版，根据机器 CPU 架构选择不同的安装包。
出现这个界面表示安装成功。

运行 Docker
首次运行接受协议和跳过登录

3.如果不足 100G，可以在安装完成docker后，在下图的位置重新选一个剩余空间大于 100G 的磁盘文件夹。

三、安装服务端

采用Docker方式安装，docker-compose如下：

docker-compose.yml文件在/deploy目录下。
在/deploy目录执行docker-compose up -d
由于镜像已更换为阿里云国内源，下载速度更快，但仍需耐心等待（预计 30 分钟左右，具体取决于网络情况）
看到Dokcer 中出现三个服务，表示成功了

四、客户端

客户端安装包已存放在/Releases目录下
双击HeyGem-x.x.x-setup.exe即可安装

04开放 API

我们开放了模特训练和视频合成的API，Docker 启动后会在本地暴露几个端口，通过http://127.0.0.1可以调用。

具体代码可以参考

src/main/service/model.js
src/main/service/video.js
src/main/service/voice.js

一、模特训练

将视频分离为静音视频 + 音频
音频放到D:\heygem_data\voice\data下

D:\heygem_data\voice\data是与guiji2025/fish-speech-ziming服务约定的，可以在docker-compose中修改

3. 调用接口：

http://127.0.0.1:18180/v1/preprocess_and_tran

参数示例：
{"format": ".wav","reference_audio": "xxxxxx/xxxxx.wav","lang": "zh"}

返回示例：
{"asr_format_audio_url": "xxxx/x/xxx/xxx.wav","reference_audio_text": "xxxxxxxxxxxx"}

记录下返回结果后续音频合成需要用到

二、音频合成接口

http://127.0.0.1:18180/v1/invoke

三、视频合成接口

http://127.0.0.1:8383/easy/submit

联系我们

James@toolwiz.com

更多资讯，欢迎关注【硅基智能】公众号