[Python] requests + lxml爬取网页图片

本文介绍了如何使用Python的requests和lxml库来爬取网页中的图片。详细讲述了请求头设置Referer的重要性,以及在面对图片懒加载时选择data-src属性的原因。并提供了完整的爬虫代码示例。
摘要由CSDN通过智能技术生成

[Python] requests + lxml爬取图片

使用python中的requests库和lxml库爬取特定网站上的图片。


一、模块介绍

1. requests模块

requests库是一个python第三方库,基于urllib编写,用于发送网络请求,访问网络资源。

常用方法

# 使用前导入模块
import requests

url = 'http://www.baidu.com'
param = {
   'key': 'value'}
header = {
   'User-Agent': 'Mozilla/5.0 ......'}

# 发送get请求
response = requests.get(url)
response = requests.get(url, param=param, header=header)

# 发送post请求
response = requests.post(url, data=param)

print(response.content)

2. lxml模块

lxml是一个HT

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值