爬取虎牙主播图片

本例中使用第三方库requests、lxml

在命令行中输入

pip/pip3 install requests
pip/pip3 install lxml

如下图所示

 本次实例比较简单 注释中每一步写的也很详细 所以我们直接上代码

demo.py

import requests
from lxml import etree

# 找到抓取目标的所在位置   知道网址
url = 'https://www.huya.com/g/4079'

# 从网址中抓取
response = requests.get(url)
# print(response.text)

# 对得到的数据进行筛选工作
html = etree.HTML(response.text)   # 打包代码
# print(html)
image_list = html.xpath('//img[@class="pic"]')   # 得到所有图片的标签
# print(image_list)

# 把一组标签拆分为单个标签
for image_data in image_list:
    image_url = image_data.xpath('./@data-original')[0]     # 从单个标签中抽取出图片链接
    image_url = image_url.split('?')[0]     # 剪掉链接中?后面的所有数据
    # print(image_url)
    image_name= image_data.xpath('./@alt')[0]      # 获取主播名字的文字信息

    # 把图片数据保存到电脑上 文件操作
    image = requests.get(image_url)     # 请求图片数据内容

    with open('./%s.jpg' % image_name, 'wb') as file:      # 创建一个空白的图片文件
        file.write(image.content)      # 向空白的图片文件里写入得到的图片数据

    print(' 《%s》 下载成功!' % image_name)

在这里提醒我们的男同胞们注意身体哦!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值