下载faceScrub人脸数据库(单线程版本)

本文介绍如何利用Python脚本从faceScrub数据库中下载名人的人脸图像。faceScrub包含530位名人约107,818张清晰图像。文章提供了单线程下载的代码实现,但指出该方法速度较慢。" 136970882,20060534,TDengine数据库迁移:全面指南,"['tdengine', '数据库', '大数据', '数据迁移']
摘要由CSDN通过智能技术生成

faceScrub 数据库是一个公共的名人人脸数据库,其相对与其他的数据库来说,优点是图像比较多,而且清晰度比较好,共有 107,818 张人脸图像, 涵盖530 个名人, 每个人大约200张图片。


居于版权的信息,该数据只提供了图片的链接,没有提供图片本身,跟另外一个数据库PubFig类似,所以我们需要自己写脚本来完成这个图像提取的功能。


这个数据库的文件在这里:http://vintage.winklerbros.net/facescrub.html 下载,文件不大,压缩后的大小只有8M多。


文件格式如下

  1. name    image_id    face_id url bbox    sha256  
  2. Aaron Eckhart   1   1   http://upload.wikimedia.org/wikipedia/commons/5/5d/AaronEckhart10TIFF.jpg   53,177,418,542  dec996994cf1eec33b53c203cff0e8f25638829fa2ad71bb0307d308fa11cdac  
  3. Aaron Eckhart   2   2   http://movies.dosthana.com/sites/default/files/image-gallery/Aaron-Eckhart-Image.jpg    80,102,260,282  f84d0c3b1b854a51e6bc031bc353e801834e81df795e85ec1589ca895fb7c1ae  
  4. Aaron Eckhart   3   3   http://upload.wikimedia.org/wikipedia/commons/5/52/Aaron_Eckhart_-_002.jpg  203,802,975,1574    8548658ef00f2ac4c384fbfff9d3ae225b4b9e0c2aa45e79a97420381c0f84c9  
  5. Aaron Eckhart   4   4   http://25.media.tumblr.com/nJ2vga5sae9o2ks4FltK2lYvo1_400.jpg   62,90,231,259   658d83f35859d2f313ff660c1900427c21eae1c41e3035307428f62b645e64d7  
  6. Aaron Eckhart   5   5   http://upload.wikimedia.org/wikipedia/commons/5/5e/Aaron-Eckhart-Traveling.jpg  276,120,492,336 1fa14fed3371280e8785df42cdc5d0335e7923a38f1b0632e3b88a52e850825f  
  7. Aaron Eckhart   6   6   http://media.zenfs.com/en_us/Movies/PhotoG/2nd-annual-ampas-governors-awards-2010-aaron-eckhart-53335.jpg   235,158,540,463 121e8bea5caae215b537dc116534bbd2fa7a9a60c1910764d78794ec185aa527  
  8. Aaron Eckhart   7   7   http://img2.timeinc.net/people/i/2008/news/080804/aaron_eckhart.jpg 60,57,178,175   bb2e227a9420d6325b67974231d334fc4620e807543a16030d51b35fa8a092f3  

所以我们可以很容易的采用提取文本的方法直接去读取和存储图像。


由于最近在学习Python,就用python来完成这个功能吧。


直接贴代码吧。

  1. # -*- coding: utf-8 -*-  
  2. """ 
  3. Created on Tue Apr 07 15:28:53 2015 
  4.  
  5. @author: Chenriwei 
  6. """  
  7.   
  8. import os  
  9. import re  
  10. import time  
  11. import urllib  
  12.   
  13. def get_all_iamge(filename):  
  14.     fid=open(filename)  
  15.     lines=fid.readlines()  
  16.     for line in lines:  
  17.         line_split=line.split('\t')  
  18.         name=line_split[0]  
  19.         image_id=line_split[1]  
  20.         face_id=line_split[2]  
  21.         box=line_split[4]  
  22.         image_url=line_split[3]  
  23.         print image_url+'\n'  
  24.         print box+'\n'  
  25.         if False == os.path.exists(name):  
  26.             os.mkdir(name)  
  27.           
  28.         try:  
  29.          urlopen=urllib.URLopener()  
  30.          fp = urlopen.open(image_url)  
  31.          data = fp.read()  
  32.          fp.close()  
  33.          file=open(name+'/'+image_id+'.jpg','w+b')  
  34.          file.write(data)  
  35.          print "下载成功:"+ image_url  
  36.          file.close()  
  37.         except IOError:  
  38.          print "下载失败:"+ image_url  
  39.   
  40. if __name__ == "__main__":  
  41.     get_all_iamge('facescrub_actors.txt')  

当然这里有个不足之处,是只采用了单线程,所以很慢,下载一个人的图像都要好久。

【6层】一字型框架办公楼(含建筑结构图、计算书) 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值