实时交互数字人项目LiveTalking，支持数字人训练、克隆、全身，已支持mac gpu~

最新推荐文章于 2025-05-03 11:16:20 发布

Cherry Xie

最新推荐文章于 2025-05-03 11:16:20 发布

阅读量827

点赞数 3

分类专栏：人工智能业界资讯文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42691309/article/details/147104483

版权

人工智能同时被 2 个专栏收录

84 篇文章

订阅专栏

36 篇文章

订阅专栏

简介

“LiveTalking” 是一个开源的实时互动数字人直播系统，旨在提供高质量的数字人直播解决方案。它由开发者 lipku 主导，托管在 GitHub 上（地址：https://github.com/lipku/LiveTalking）。截至 2025 年 4 月，该项目已获得超过 5.1k 的星标和 750 多个 fork，显示出较高的社区关注度和活跃度。

项目概述

目标：LiveTalking 致力于构建一个实时互动的数字人系统，能够实现音视频同步对话，支持直播、在线教育、虚拟客服等多种场景。
核心特点：
** 实时性：通过流式传输技术（RTMP 或 WebRTC）实现低延迟的音视频互动。
** 多模型支持：集成了多种数字人模型，包括 ER-NeRF、MuseTalk、Wav2Lip 和 Ultralight-Digital-Human。
** 支持语音克隆
** 支持在数字人说话时打断它
** 支持全身视频拼接
** 支持rtmp和webrtc
** 支持视频编排：不说话时播放自定义视频
** 支持多并发

迭代记录

在这里插入图片描述

技术栈

LiveTalking 整合了多项前沿技术，技术复杂度较高

数字人模型

ER-NeRF：基于神经辐射场的渲染技术，用于生成高质量的数字人动画。
MuseTalk：支持实时唇形同步和面部动画。
Wav2Lip：经典的唇形同步模型，适用于音频驱动的视频生成。
Ultralight-Digital-Human：轻量化数字人解决方案，优化性能。

音视频处理

支持 WebRTC 和 RTMP 协议，用于实时流传输。
依赖 FFmpeg 处理音视频流。

看看效果

在这里插入图片描述

在这里插入图片描述

相关文献

github项目地址：https://github.com/lipku/LiveTalking
实际效果参考：https://www.bilibili.com/video/BV1gEc2e3Ep1/?spm_id_from=333.788.player.player_end_recommend_autoplay&vd_source=ef215224fd573c6ab6505c231b6be959

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Cherry Xie 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。