0 引言
通用爬虫的基本步骤:
step_1 指定url > step_2 发起请求获取响应对象 > step_3 获取响应数据 > step_4持久化存储
图片的爬取原理和其他数据的爬取原理是一样的,只不过图片是以二进制数据形式存储的,其他数据在第三步step_3 获取响应数据时,要么用.text属性要么用.json()方法获取数据的,而二进制数据要使用.content属性获取,并且在第四步step_4持久化存储时写入方式是'wb',就这两个方面的不同。对于open()函数的相关参数介绍可以参考如下链接:https://blog.csdn.net/weixin_45850939/article/details/105214665
接下来用代码对某一张图片进行爬取,具体说明一下图片爬取的基本原理。
1 代码部分
import requests
# step_1 指定url
url = 'https://pic.qiushibaike.com/system/pictures/12463/124630529/medium/K0V59CJ7N9TQR58P.jpg'
# step_2 发起请求获取响应对象
response = requests.get(url=url)
# step_3 获取响应数据
img_data = response.content
#