使用Python的requests库下载文件,示例:
import requests
url = "http://example.com/file.pdf" # 文件的URL
save_path = "path/to/save/file.pdf" # 文件保存的路径
response = requests.get(url, stream=True)
response.raise_for_status()
with open(save_path, "wb") as file:
for chunk in response.iter_content(chunk_size=16384):
file.write(chunk)
这个示例中的stream=True参数是为了以流的方式下载文件,这对于大文件或网络速度较慢的情况下特别有用。然后我们使用iter_content()方法来逐块地写入文件。
在下载过程中,你可以根据需要调整chunk_size的大小,它决定了每次从网络读取多少数据。
题外话:
response.raise_for_status()是Python中requests库的一个方法,用于检查HTTP响应的状态码是否指示请求成功。
当调用raise_for_status()方法时,如果HTTP响应的状态码是4xx或5xx范围内的错误状态码(如404,500等),则会引发一个HTTPError异常。这意味着如果发生了请求错误,你可以通过捕获和处理异常来进行相应的处理。
import requests
url = "http://example.com/non_existent_page"
response = requests.get(url)
try:
response.raise_for_status()
except requests.HTTPError as e:
print(f"请求遇到错误:{e}")
else:
print("请求成功,继续处理响应...")
在上面的示例中,我们发送一个GET请求到一个不存在的页面。如果没有使用raise_for_status()方法并捕获异常,程序将会继续执行打印"请求成功,继续处理响应..."。但由于该URL是无效的,调用raise_for_status()后会引发一个HTTPError异常,并显示相应的错误消息。
因此,使用raise_for_status()方法是一种好习惯,它能帮助你及时发现和处理网络请求中的错误。