python网络爬虫与信息提取系列之Request库入门（二）

最新推荐文章于 2023-09-26 20:39:29 发布

芭蕉的测试之旅

最新推荐文章于 2023-09-26 20:39:29 发布

阅读量217

点赞数

分类专栏： python-哟

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_39115323/article/details/105140114

版权

python-哟专栏收录该内容

5 篇文章 0 订阅

订阅专栏

# 本文为学习北京理工大学慕课笔记 #

一、Requests库的get()方法

request.get( )函数完整使用方法为：

requests.get(url, params=None, **kwargs)

url：你获取页面的url链接

params：url中的额外参数，字典或字节流格式，可选

**kwargs：控制访问的参数(12个)

二、Requests库的2个重要对象( Request和Response )

1. 重点说说 Response对象

r.status_code：返回http请求是否成功，200表示成功，其他任何数字都表明连接失败

r.text：返回请求页面的具体内容

r.encoding：返回请求页面的编码方式(根据页面header推测出)

r.apparent_encoding：返回请求页面的编码方式(根据页面内容推测出)，

r.content：假如我们获取到了网页上的图片信息，该图片信息是以二进制形式存储的，那么就可以用r.content还原图片。

2. 当我们使用get()方法获取网页信息时，基本流程如下：

3. 实例：分析 r.encoding 和 r.apparent_encoding 的区别

a.首先进入python的IDLE，导入requests库，通过get()方法获取百度网页信息，查看网页访问状态

b.返回值为200，则查看一下网页内容（r.text），发现有许多看不懂的编码

c.我们分别查看一下 r.encoding返回的编码方式和 r.apparent_encoding返回的编码方式

d.可以发现返回了两个不同的编码，然后我们用备选编码r.apparent_encoding返回的编码方式替换r.encoding，再查看一下网页内容(r.text)

可以看到，返回的内容变成中文字符了。

注：requests库共有7个方法，其中requests方法为基础方法，而其余6个方法都是通过调用requests方法实现的。

芭蕉的测试之旅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。