简单爬取小姐姐的照片

使用环境

win10系统,python
先简单开始访问,获取html从而提取所需数据
import requests
url = 'https://www.douyu.com/g_yz'
response = requests.get(url=url)
html = response.text
print(html)
将输出结果往下拉,指导看到jpg相关的如下图所示在这里插入图片描述
接着就利用简单的正则表达式进行提取
import re
title_url = re.findall(r'"rn":"(.*?)","rpos":0,"rs1":"(.*?)"',html)
for title,one_url in title_url:
    print(title+"=================="+one_url)

下图便是相关结果
在这里插入图片描述

对于一个图片的下载如下所示
with open('一贫如洗的直播间 5695362.jpg','wb') as f:
    resp = requests.get(url='https://rpic.douyucdn.cn/live-cover/appCovers/2020/06/21/5695362_20200621173529_big.jpg/dy2').content
    f.write(resp)

下面是保存成功的图片
在这里插入图片描述

那么在一个循坏里也是同理的
for title,one_url in title_url:
    with open(title+'.jpg','wb') as f:
        resp = requests.get(url=one_url).content
        f.write(resp)
    print(title+'======================保存成功')

输出结果:
在这里插入图片描述

看成品

在这里插入图片描述
优化后的源码如下:

import requests
import re
import os
import time

url = 'https://www.douyu.com/g_yz'
response = requests.get(url=url)
html = response.text


title_url = re.findall(r'"rn":"(.*?)","rpos":0,"rs1":"(.*?)"',html)
os.chdir('小姐姐\\')
for title,one_url in title_url:
    with open(title+'.jpg','wb') as f:
        resp = requests.get(url=one_url).content
        f.write(resp)
    print(title+'======================保存成功')
    time.sleep(0.5)
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值