批量下载第一步,将下载地址保存在一个文件中,如gaokao
gaokao
http://wenku.baidu.com/download?doc_id=41cbbc0471fe910
http://wenku.baidu.com/download?doc_id=fc9dd14bf111f18
http://wenku.baidu.com/download?doc_id=f14b695784254b3
http://wenku.baidu.com/download?doc_id=b36b5ef5f242336
批量下载第二步,用Python程序读取该文件, 调用wget命令,下载。
–content-disposition 这个参数,使得下载到的 文件名是服务器上的那个。
import os
f = open('gaokao')
content = f.read().split("\n")
for line in content:
if not line:
break
cmd = 'wget --content-disposition "%s" ' % line
os.system(cmd)