Python爬虫之自动创建请求对象

最新推荐文章于 2023-07-23 23:26:40 发布

PythonWithCar

最新推荐文章于 2023-07-23 23:26:40 发布

阅读量446

点赞数 2

分类专栏： Python爬虫人生

本文链接：https://blog.csdn.net/qq_36510630/article/details/104201239

版权

Python爬虫人生专栏收录该内容

4 篇文章 1 订阅

订阅专栏

【导读】记录学习爬虫的过程
【主题】Python爬虫之自动创建请求对象

from urllib import request
import re
url = r'http://www.baidu.com/'
#创建自定义请求对象
req = request.Request(url)
pat = r'<title>(.*?)</title>'
#发送请求
reponse = request.urlopen(req ).read().decode()
data = re.findall(pat,reponse)
print(data[0])
#输出
#百度一下，你就知道

【分析】
1.当直接使用 request方法时时，request会自动创建请求对象，然后对象发送请求，获取详细信息。缺点在于自动创建的对象无法进行二次封装；
2.自定义请求对象方式：req = request.Request(url)，自定义的request中还可以存放HTTP请求头User-Agent等信息。见下一节。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

PythonWithCar

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫之自动创建请求对象

【导读】记录学习爬虫的过程【主题】构建Python爬虫自定义请求from urllib import requestimport reurl = r'http://www.baidu.com/'#创建自定义请求对象req = request.Request(url)pat = r'<title>(.*?)</title>'reponse = request....
复制链接

扫一扫