python爬虫:爬取百度小姐姐照片

本文详细介绍了如何使用Python爬虫爬取百度上的小姐姐照片。从项目流程开始,包括准备工作、分析网页、发送网络请求、解析JSON数据,到最后的下载图片,一步步教你实现图片的抓取与保存。
摘要由CSDN通过智能技术生成

自从学会了爬虫,身体状况一天不如一天,营养都跟不上了,教大家爬取百度性感小姐姐的图片,先看一下效果。

在这里插入图片描述

项目流程

第一步:准备工作

工欲善其事,必先利其器

  • pip install requests,该模块用来发送网络请求
  • pycharm编写代码。
  • Chrome浏览器便于解析网页内容。

第二步:分析网页

想要从某个网站获取数据,首先肯定要熟悉这个网站,知彼知己,百战不殆。

  • 使用Chrome浏览器,百度图片搜索“小姐姐”
  • F12进入调试模式

图一

  • 依次点击图一的1.Network、2.XHR。然后鼠标鼠标移动到3的位置向下滚动滚轮,会发现4号位置会不断的出现新的内容。
    图二
  • 如图二所示,点击1号区域中的随便一个,再点击2号response,会看到3号区域出现了一堆json数据,我们要抓到小姐姐url地址就在这堆json数据中
    图三
    在这里插入图片描述
    在这里插入图片描述
  • 如图三所示,依次点击1号区域的每个内容,然后点击2号位置Heaters分析每个内容的url,会在三号区域横线处发现一个规律,每次向下拖动百度会返回30个图片。

第三步:发送网络请求

  • 导入requests第三方库
import requests
  • 把url地址复制出来
url='https://image.baidu.com/search/acjson?tn=resultjson_com&logid=2975623535251405494&ipn=rj&ct=201326592&is=&fp=result&queryWord=%E5%B0%8F%E5%A7%90%E5%A7%90&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=&copyright=&word=%E5%B0%8F%E5%A7%90%E5%A7%90&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&force=&pn=&rn=30&gsm=1e&1620226623245='
  • 构造请求头headers,只有构造了请求头,百度才会误以为是一个正经的浏览器在访问它。
headers = {
   
    "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_42847500

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值