2025年3月,硅基智能正式开源发布全球Top级数字人模型HeyGem.ai,迅速成为开发者社区热议焦点。用户仅需一张照片或一秒视频,即可生成高度逼真的数字分身,完整复刻面容与声音,并在60秒内输出4K高清视频口播。更令人兴奋的是,HeyGem.ai采取了免费、无限制、完全离线运行的开源策略,用户最低仅需一块NVIDIA 1080Ti显卡,即可在本地实现完整的数字人克隆和视频合成,无需额外的算力投入,技术小白也能0门槛上手!
目前,HeyGem.ai代码已上线魔乐社区,欢迎下载体验:
https://modelers.cn/models/Modelers_Park/HeyGem.ai(或点击文末阅读原文直达)
今天,为大家分享由魔乐社区开发者带来的喂饭级部署教程。本教程将详细介绍 HeyGem.ai的基本概念、硬件基础要求,手把手带你完成HeyGem的快速部署,体验HeyGem的强大能力。无论你是资深技术达人还是刚入门的小白,都能从中找到启发,体验数字人视频合成的无限可能!
01
HeyGem是什么
HeyGem是一款开源的数字人视频合成工具,它能够精确克隆真人的外貌和声音,实现文字和语音驱动的虚拟形象视频合成。其核心优势包括:
-
精确克隆:利用先进AI算法,高精度捕捉面部特征与声音细节,实现高仿真数字人效果。
-
简单易用:操作界面直观,即使是技术小白也能快速上手;同时支持多模型导入和一键管理。
-
高效视频合成:保证音视频同步与口型匹配,生成的视频流畅自然。
HeyGem旨在为用户提供一站式数字人创作体验,无论是个人创作者还是企业业务,都能从中受益。
02
硬件基础要求
在开始部署 HeyGem前,请确保你的硬件环境符合以下要求:
1 存储要求:
-
D 盘:用于存储数字人数据和作品,建议空闲空间不少于 30GB。
-
C 盘:存放 Docker 镜像等服务文件,建议空闲空间不少于 100GB;若不足,可在 Docker 安装时指定其他磁盘路径。
2 系统要求:
-
操作系统:Windows 10 19042.1526 或更高版本。
-
CPU:建议使用第13代英特尔酷睿i5-13400F 或更高配置。
-
内存:32GB 及以上。
-
显卡:必须有英伟达显卡,建议 RTX 4070 或以上;确保安装正确的显卡驱动(英伟达驱动下载)。
3 软件环境:
-
Node.js:建议安装 Node.js 18 版本。
-
Docker:使用 Docker 部署服务,推荐使用国内镜像以获得更快的下载速度。
-
WSL:Windows Subsystem for Linux,用于支持部分 Linux 命令及工具。
03
安装步骤
本教程在国内网络环境下进行,分为前置环境配置、服务端安装及客户端使用三大部分。
1. 安装Node.js 18
1) 访问 Node.js 下载页面(https://nodejs.org/zh-cn/download),选择 Windows 版下载并安装。
2) 安装完成后,在命令行中输入 node -v,确保显示版本为 18。
2. 安装Docker镜像
使用国内镜像拉取 Docker 镜像,加快下载速度。打开命令行,依次执行以下命令:
docker pull crpi-87t8jkvf79rj7hal.cn-huhehaote.personal.cr.aliyuncs.com/modelers_park/fun-asr:latest
docker pull crpi-87t8jkvf79rj7hal.cn-huhehaote.personal.cr.aliyuncs.com/modelers_park/fish-speech-ziming:latest
docker pull crpi-87t8jkvf79rj7hal.cn-huhehaote.personal.cr.aliyuncs.com/modelers_park/heygem.ai:latest
3. 安装 WSL
检查是否已安装 WSL: 在命令行输入 wsl --list --verbose,若已安装则无需重复安装。
若未安装: 执行命令:
wsl --install
更新 WSL: 执行命令:
wsl --update
4. 安装 Docker Windows 版
下载:前往 Docker 官网下载适合你 CPU 架构的安装包: https://www.docker.com/
安装:按照安装向导操作,接受协议并跳过登录,直至安装成功。
5. 安装服务端
服务端采用 Docker 部署,具体步骤如下:
获取项目代码:
访问魔乐社区项目地址https://modelers.cn/models/Modelers_Park/HeyGem.ai 拉取社区优化版项目代码。
启动 Docker 服务:
进入项目目录下的 /deploy 文件夹,确保其中包含 docker-compose.yml 文件。
在该目录下执行命令:docker-compose up -d等待下载和启动过程(预计 30 分钟左右,视网络环境而定),直到 Docker 中显示三个服务处于 Running 状态。
6. 安装客户端
客户端安装:
下载官方构建的安装包,路径位于 HeyGem.ai\Releases 目录。
双击 HeyGem-x.x.x-setup.exe 安装客户端。
04
实测效果
1. 打开客户端后,点击“这里定制数字人”开始数字人模板定制。
2. 定制好数字人后根据提示上传 10-30 秒的音频,并输入文案进行试听。
3. 点击右上角“合成视频”按钮开始视频生成。
4. 测试环境建议:推荐显卡最低 12G 显存,测试机器为 4090 24G 显存。
稿件征集
你的每一次分享,都可能成为他人的灵感源泉。无论是技术干货、开发实践,还是你与魔乐社区的精彩故事,我们都期待聆听。投稿作品一经采纳,不仅将在官方平台展示,更能让你的创意与经验被更多人看见。
投稿邮箱:contribute@modelers.cn