python爬虫：爬取百度小姐姐照片

最新推荐文章于 2023-12-18 15:06:41 发布

qq_42847500

最新推荐文章于 2023-12-18 15:06:41 发布

阅读量407

点赞数 1

分类专栏：爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/qq_42847500/article/details/116445704

版权

本文详细介绍了如何使用Python爬虫爬取百度上的小姐姐照片。从项目流程开始，包括准备工作、分析网页、发送网络请求、解析JSON数据，到最后的下载图片，一步步教你实现图片的抓取与保存。

摘要由CSDN通过智能技术生成

自从学会了爬虫，身体状况一天不如一天，营养都跟不上了，教大家爬取百度性感小姐姐的图片，先看一下效果。

在这里插入图片描述

项目流程

第一步：准备工作

工欲善其事，必先利其器

pip install requests，该模块用来发送网络请求
pycharm编写代码。
Chrome浏览器便于解析网页内容。

第二步：分析网页

想要从某个网站获取数据，首先肯定要熟悉这个网站，知彼知己，百战不殆。

使用Chrome浏览器，百度图片搜索“小姐姐”
F12进入调试模式

依次点击图一的1.Network、2.XHR。然后鼠标鼠标移动到3的位置向下滚动滚轮，会发现4号位置会不断的出现新的内容。
如图二所示，点击1号区域中的随便一个，再点击2号response，会看到3号区域出现了一堆json数据，我们要抓到小姐姐url地址就在这堆json数据中
如图三所示，依次点击1号区域的每个内容，然后点击2号位置Heaters分析每个内容的url，会在三号区域横线处发现一个规律，每次向下拖动百度会返回30个图片。

第三步：发送网络请求

导入requests第三方库

import requests

把url地址复制出来

url='https://image.baidu.com/search/acjson?tn=resultjson_com&logid=2975623535251405494&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%B0%8F%E5%A7%90%E5%A7%90&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%B0%8F%E5%A7%90%E5%A7%90&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&force=&pn=&rn=30&gsm=1e&1620226623245='

构造请求头headers，只有构造了请求头，百度才会误以为是一个正经的浏览器在访问它。

headers = {
   
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS

最低0.47元/天解锁文章

qq_42847500

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录