点击蓝字关注我们
Python爬虫中有两种下载图片的方式,一种是基于requests模块,另一种是基于urllib模块,requests和urllib都是爬虫中用来发起网络请求的模块,有异曲同工之妙,不过requests模块使用起来更方便、高级,所以大家都渐渐地不再使用urllib模块了。
一、基于requests模块进行图片下载img_url是图片的url地址,是我随便从百度图片中找的一张图片。无论是图片还是视频,都是以二进制形式进行存储和传输的,所以就可以在获取到url地址的响应数据后,以二进制方式写入文件就可以了。
#方式1:基于requestsimport requestsheaders = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.204 Safari/537.36'}img_url = 'https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1589997412390&di=eddf804a68f06487a81895c38506b6dd&imgtype=0&src=http%3A%2F%2Fn.sinaimg.cn%2Fsinacn08%2F222%2Fw640h382%2F2018060