FaceForensics++数据库下载(超详细版教程)
相信很多做deepfake相关研究的朋友,在对模型进行测试或者对潜前人的研究进行复现时,都需要下载一系列数据库并进行预处理等操作,而FaceForensics++数据库是一个由数千个使用不同DeepFake方法操纵的视频组成,并包含四个假子数据集,即DeepFake Detection (DFD), DeepFake (DF), Face2Face (F2F)和FaceSwap (FS)。
由于这是国外的数据集所以一下的操作都需要挂代理来实现:(如果小伙伴无法挂代理可以评论留言,我发给你)
获取下载脚本并并保存到本地
ondyari/FaceForensics: Github of the FaceForensics datasethttps://github.com/ondyari/FaceForensicsff++的官网如上,按照上面的要求填写谷歌的表格,他会通过邮件给你发脚本代码,这里不赘述,我会在文章最后附上这个代码,大家就可以不用填写表格了。
CMD窗口下载数据库
打开cmd窗口
将文后我给的代码粘贴并后缀改为.py文件,确保你的文件命名为FaceForensics++.py
cd you_dir # 转到这个.py文件所属的文件夹下
接着cmd窗口会显示已经进入目标文件夹,接着输入下载命令:
python FaceForensics++.py
//前面的python指你的电脑本身的python.exe文件,注意并不一定是“python”,需要观察你自己下载的python中的pythin.exe文件的命名是什么,比如笔者下载的python运行文件的命名是python3.11.exe,所以这里就应该python3.11
<output path>
//这里意思是数据下载的地址,即你的数据集要放在哪里(注意存储空间要足够)
-d <dataset type, e.g., Face2Face, original or all>
//如果你要下载FaceForensics++全部直接-all即可,也可以选择FaceForensics++数据集其中的一项来下载
-c <compression quality, e.g., c23 or raw>
//这里指压缩参数选择,如果想要下载原始数据可以选-raw,笔者下载的是-23压缩版
-t <file type, e.g., videos, masks or models>
//文件下载的类型-video即可下载deepfake的video
比如,要在D盘上的FaceForensics++文件里下载FaceForensics++数据集全部视频,以C23参数压缩,命令可以是:
python3.11 FaceForensics.py E:/FaceForensics++ -d all -c c23 -t videos
注意,运行过程中如果出现“502 BadGateway”提示,可能是你的服务不能使用脚本默认的,而是需要更改,脚本里面提供了三个server可供选择,分别是EU,EU2和CA,对应了欧洲1,2和加拿大,默认使用的是EU,脚本这部分代码如下:
parser.add_argument('--server', type=str, default='EU',
help='Server to download the data from. If you '
'encounter a slow download speed, consider '
'changing the server.',
choices=SERVERS
)
args = parser.parse_args()
# URLs
server = args.server
if server == 'EU':
server_url = 'http://canis.vc.in.tum.de:8100/'
elif server == 'EU2':
server_url = 'http://kaldir.vc.in.tum.de/faceforensics/'
elif server == 'CA':
server_url = 'http://falas.cmpt.sfu.ca: