利用Python下载文件也是十分方便的:
小文件下载
下载小文件的话考虑的因素比较少,给了链接直接下载就好了:
import requests
image_url = "https://www.python.org/static/community_logos/python-logo-master-v3-TM.png"
r = requests.get(image_url) # create HTTP response object
with open("python_logo.png",'wb') as f:
f.write(r.content)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
大文件下载
如果是小文件的话,一次性下载就OK了,但是如果文件比较大的话,那么下载下来的文件先放在内存中,内存还是比较有压力的。所以为了防止内存不够用的现象出现,我们要想办法把下载的文件分块写到磁盘中:
import requests
file_url = "http://codex.cs.yale.edu/avi/db-book/db4/slide-dir/ch1-2.pdf"
r = requests.get(file_url, stream=True)
with open("python.pdf", "wb") as pdf:
for chunk in r.iter_content(chunk_size=1024):
if chunk:
pdf.write(c