一,先在创建好的项目里 搭建框架
1,导入项目需要的库
2,获取网站源代码
想要爬取网站内容,就必须先获取网站源代码如图:
3,提取图片原地址
如图:
4,获取图片二进制码
如图:
5,创建一个文件夹
获取到了图片,相应的也要创建一个用于保存的文件夹,如图:
6,定义main函数调用get_html函数
如图:
至此我们的爬取框架就搭建完成了 下面就添加我们想要爬取的目标就可以了
二,图片导入
1,以百度搜索:“大熊猫”图片举例,当我们搜索到大熊猫图片后,鼠标右键事件 点击检查
如图:
2,然后点击网络:
如图:
3,然后鼠标滚轮持续向下滚动,Fetch/XHR中就会不断出现内容如图:
4,然后选中其中一个点击进入,选择标头
将请求url:中的内容复制 粘贴到python工程文件的url处如图:
然后 将相应标头的内容全部复制下来 粘贴在pytho工程项目的headers中 再粘贴之前记得事先输入三个双引号如图:
随后再在网页中点击 负载 将负载里面的全部复制 粘贴到params中如图:
完成以上操作后 我们爬取框架就基本能够运行了