用Python爬虫,爬取神秘图片

前言

今天教大家用Python采集一个二次元小姐姐图片, 里面漂亮的小姐姐******,懂的都懂,快学起来吧
在这里插入图片描述
话不多说,直接开始

开发环境

  1. python 3.6
  2. pycharm
  3. requests
  4. parsel
  5. os

步骤:

  1. 找数据相对应的链接

  2. 发送地址请求

  3. 数据解析<解析我们要的数据>

  4. 然后数据保存(本地)

1. 第一步,找到链接地址

在这里插入图片描述

代码如下

# url编码: 中文在请求和响应的时候转码, http协议默认不支持中文, 由 % 字母 数字
request_address = f'https://www.jdlingyu.com/tag/%e5%b0%91%e5%a5%b3/page/{page}'
# 代表浏览器身份标识
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}

2. 编写一个代码发送地址的请求

response = requests.get(url=request_address, headers=headers)
html_data = response.text  # 字符串 -- 正则
print(html_data)

试试看对不对,不对再改

3. 数据解析<解析我们要的数据> html数据.xpath

selector = parsel.Selector(html_data)  # 转换数据类型
 
lis = selector.xpath('//div[@id="post-list"]/ul/li')  # 所有相册的标签
 
for li in lis:  # 一个一个操作相册标签对象
    pic_title = li.xpath('.//h2/a/text()').get()  # 相册标题
    pic_href = li.xpath('.//h2/a/@href').get()  # 相册地址
    print(pic_title, pic_href)

在这里插入图片描述

4. 再保存数据

with open(f'img\\{pic_title}\\{pic_name}', mode='wb') as f:
    f.write(img_data)
    print('保存完成:', pic_name)

运行

学会了吗
在这里插入图片描述

想要源码的加扣裙:704942100里面还有免费学习资料

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值