简介
最近,一个名为Deep-Live-Cam的开源项目在GitHub上引起了广泛关注,一口气登上了github趋势榜第一名:
这个项目由hacksider开发,它允许用户通过单张图片实现实时面部交换,创造出令人难以置信的深度伪造视频。
例如,你可以使用马斯克的正脸照来表演一段不失尴尬的微笑:
与之前其他深度伪造技术相比,Deep-Live-Cam能够实现实时面部交换,用户只需要一张目标人物的图片即可进行面部交换,简化了操作流程,这对于直播或即时视频编辑非常有用。
使用的技术
Deep-Live-Cam 背后的核心是一系列先进的AI算法和模型,包括但不限于:
- GFPGAN:一种用于面部修复和增强的生成对抗网络。
- inswapper:一个ONNX模型,用于实现面部交换。
- ffmpeg:一个强大的多媒体框架,用于视频处理。
项目还支持多种硬件加速方案,包括CUDA、CoreML、DirectML和OpenVINO™,以适应不同平台和硬件环境。
项目搭建
搭建Deep-Live-Cam项目需要一定的技术基础,以下是详细的搭建步骤:
环境准备:确保系统中已安装Python 3.10(推荐)、pip、git和ffmpeg。对于Windows用户,还需安装Visual Studio 2022 runtimes。
克隆仓库:通过git命令克隆项目到本地:
git clone https://github.com/hacksider/Deep-Live-Cam.git
下载模型:从指定链接下载GFPGANv1.4和inswapper_128_fp16.onnx模型文件,并放入项目目录下的"models"文件夹。
安装依赖:使用pip命令安装项目依赖:
pip install -r requirements.txt
配置执行提供者(如需GPU加速):
- 对于Nvidia用户,安装CUDA Toolkit 11.8,并使用以下命令安装或更新ONNX Runtime GPU版本:
pip uninstall onnxruntime onnxruntime-gpu
pip install onnxruntime-gpu==1.16.3
运行项目:在项目目录下运行:
python run.py
项目的使用方法
使用Deep-Live-Cam非常简单直观:
- 运行程序后,选择一个包含所需面部的图片作为源图片。
- 选择目标图片或视频,即你想要替换面部的原始素材。
- 点击“Start”开始面部交换过程。
- 程序将实时生成深度伪造视频,并在指定的输出目录下保存结果。
此外,项目还提供了命令行参数,允许用户自定义视频编码器、视频质量、内存使用等高级选项。
免责声明
用户在使用过程中应遵守当地法律法规,尊重他人的肖像权和隐私权。在使用真实人物面部时,应获得其明确同意,并在使用深度伪造内容时明确标注。软件开发者及本公众号不对最终用户的行为负责。
结语
Deep-Live-Cam是AI技术在媒体制作领域的一次大胆尝试,它不仅展示了技术的力量,也提醒我们在使用技术时需要承担的责任。我们期待这个项目能够在确保安全和道德的前提下,为创意产业带来更多的可能性。
项目地址:https://github.com/hacksider/Deep-Live-Cam
原文地址:https://www.xplaza.cn/topic/topicView?topicId=1180