urllib、urllib2、requests关系

最新推荐文章于 2024-03-29 15:29:00 发布

cent袁

最新推荐文章于 2024-03-29 15:29:00 发布

阅读量477

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/unicorn_mitnick/article/details/89066934

版权

python 专栏收录该内容

10 篇文章 2 订阅

订阅专栏

简单记录一笔，有点乱，后面补充ps:比较各个库特性太多了

urllib和urllib2是python标准库，就是你安装了python，这两个库就已经可以直接使用了；requests是第三方库，不是python基金会实现的，但是功能是很强大的。

urllib和urllib2

这两个标准库做爬虫也基本够用了，不用requests也是可以的，urllib2是urllib的增强。

urllib和urllib2都是通过url打开资源，其中urllib短板是在太大，例如它只能接受url，却如法对请求进行headers的伪装，这样写的爬虫发送的请求会被很多网站直接阻挡掉。
因此python基金会不得不推出urllib2对这块功能进行增强。
1. urllib2.urlopen可以接受一个Request对象或者url，并以此设置一个URL的headers。
2. 如果你访问一个网站，想更改User Agent（可以伪装你的浏览器），你就要用urllib2。
3. urllib支持设置编码的函数，urllib.urlencode,在模拟登陆的时候，经常要post编码之后的参数，所以要想不使用第三方库完成模拟登录，你就需要使用urllib。
4. urllib2模块没有加入urllib.urlretrieve函数以及urllib.quote等一系列quote和unquote功能，因此有时也需要urllib的辅助
但是问题在于urllib2并没有完全取代urllib的所有功能，比如urllib中的urlencode()方法，在urllib2中就是没有的。所以urllib和urllib2不得不一起使用。

urllib3
Urllib3是一个功能强大，条理清晰，用于HTTP客户端的Python库，许多Python的原生系统已经开始使用urllib3。Urllib3提供了很多python标准库里所没有的重要特性：
1.线程安全
2.连接池
3.客户端SSL/TLS验证
4.文件分部编码上传
5.协助处理重复请求和HTTP重定位
6.支持压缩编码
7.支持HTTP和SOCKS代理

Requests

Requests 使用的是 urllib3，继承了urllib2的所有特性。Requests支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动确定响应内容的编码，支持国际化的 URL 和 POST 数据自动编码。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。