python实战-爬取斗鱼所有颜值主播头像

#coding:utf-8
import requests
import re
'''
爬取斗鱼所有颜值主播头像
'''
# 使用列表推导式生成要爬取的网页url列表
page_list = ["https://www.douyu.com/gapi/rknc/directory/yzRec/{}".format(i) for i in range(1, 5)]
print(page_list)

# 遍历每一个网页url列表
for page in page_list:

    # 分别对每一个url进行请求
    html_content = requests.get(page).content.decode()

    # 使用正则表达式筛选出所有图片的url并储存到一个列表中
    photo_url_list = re.findall(r'https:.*?\.(?:jpg|png)', html_content)
    # print(photo_url_list)

    # 遍历每一张图片url列表
    for photo_url in photo_url_list:
        # 过滤掉不需要的图片
        if photo_url.endswith("big.jpg"):
            # 使用字符串切片的方式, 提取出图片名称
            photo_name = photo_url.split('/')[-1]
            # print(photo_name)
            # 对每一个图片url进行请求并返回图片的二进制信息
            photo_request = requests.get(photo_url).content
            # 在本地打开一个文件, 将获取的图片信息写进该文件
            with open('./photo/{}'.format(photo_name), 'wb') as f:
                f.write(photo_request)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值