import urllib
import urllib2
import os
import re
f=open("E:\\data\\faceScrub\\facescrub_actresses.txt")
i=f.read()
save_path="E:\\data\\faceScrub\\"
list1=i.split()
pat = re.compile('http://(.)+')
idx=1
for s in list1:
m = re.search('http', s, re.IGNORECASE)
if bool(m):
print s
fileName=save_path+str(idx)+".jpg"
try:
urllib.urlretrieve(s,fileName)
idx=idx+1
except Exception,e:
print e
此版本比较粗糙,面对需要输入用户名和密码的网址就无法继续了。