爬取图片需要的几大步骤:
1.需要Python工具(本人使用的是3.5)
2.需要安装几个常用的模块,例如:requests,re,urllib.request ,time
requests模块作用是为了获取你需要爬取得网页的内容
re模块是将要使用正则表达式,获得你需要的图片的下载地址(ps:正则表达式虽然很好用,但是好复杂的说,我只会用最简单的)
urllib.request 模块是通过re模块获得的下载地址将图片下载到本地
个人很喜欢火影忍者,选择了火影中的人物进行了练习,爬取了30页的内容,代码如下:
import requests
import re
import urllib.request
import time
url='https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%AE%87%E6%99%BA%E6%B3%A2%E6%96%91&cl=&lm=&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&word=%E5%AE%87%E6%99%BA%E6%B3%A2%E6%96%91&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc