简介
最近搜寻公开的人脸数据库时发现vgg-face-data的数据量相比于webface还算挺大,不过下载下来之后才发现官网给出的只是图片的id和url以及一些其他信息,遂写一个python脚本进行下载。图片地址信息请自行去官网下载,这里给出链接。
vgg_face_dataset.tar.gz
主要思想
vgg_face_dateset给出的链接方式是每个人一个txt文件,每个文件里面包含1000行左右内容,每行包括图片id,图片url等信息,只需遍历这些文件下载即可,而且这些文件之间没有数据共享,最适合使用多线程方法进行。在下载脚本同级目录下新建image文件夹,下载图片全部保存到该文件夹下,每个identity一个子文件夹。
download.py
代码比较简单,具体功能一看就懂:
#!/usr/bin/python
#-*- coding: utf-8 -*-
"""
Created on Sat. Apil 8 09:19:38 2017
@author: wujiyang
"""
import sys
import os
<