(一)
要想写好这个程序,首先我们得把框架搭好。
一、导入相应的库
二、编写获取网站源代码与图片源代码
三、因为是自动爬取多张图片,所以我们编写一个保存图片和新建文件夹用来保存爬取的图片。
四、定义一个main函数,里面用来写网站的一些信息
最后调用main函数
到这里,我们的框架就搭好了。
(二)
然后我们就可以从网页中获取我们需要的信息
这里我们以百度搜索喜羊羊为例
一、打开百度搜索喜羊羊图片,点击鼠标右键,点击检查,再按如图所示点击
二、我们再从中获取所需信息,如图
复制以上信息,分别粘贴在代码中的url,headers,params。
如图,并在冒号前后内容各用双引号括起来,并删除无内容的信息
下面的params中的word。queryWord和pn都要进行改写,我写的是如下的样子
以上,代码就完全写成了。
(三)
运行。
我们以喜羊羊为例
我们再从工程目录中可以看见多了叫”喜羊羊“的文件夹并且里面有了图片
以上便是python自动爬取图片的所有步骤。