python爬虫模块:urliib2的基本使用

星空丶流云

于 2018-11-28 20:16:30 发布

阅读量1k

点赞数 2

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39516769/article/details/84591608

版权

urllib2是Python自带的网页抓取模块，不需要自己安装，该模块可以实现对网页的抓取(附带请求报头)。

urllib2模块的方法介绍：
urlopen(请求地址)：这个方法只能发送url地址请求，不能自己构建请求报头，服务器端显示的报头为urllib2模块中设置的请求报头。
源码:
在这里插入图片描述

Request(请求地址):这个方法可以自己构建请求报头，Rquest方法有两个参数。参数1是请求地址，参数2是请求报头，也就是headers。
源码:
请求报头有很多，这里只发入一个。
在这里插入图片描述

add_headers():该方法时添加请求报头，有两个参数，分别代表请求报头的键和值(该方法不常用)
源码: 在这里插入图片描述
get_header( ):该方法时获取请求报头，参数为想获取的请求报头名(该方法不常用)。
源码:

getcode( ):获取请求响应状态码，该方法需要在请求结束后使用。
源码: 在这里插入图片描述

这是我第一次写博客，如果有什么错误或者更好的建议请与我联系。

星空丶流云

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
python爬虫模块:urliib2的基本使用

urllib2是Python自带的网页抓取模块，不需要自己安装，该模块可以实现对网页的抓取(附带请求报头)。urllib2模块的方法介绍：urlopen(请求地址)：这个方法只能发送url地址请求，不能自己构建请求报头，服务器端显示的报头为urllib2模块中设置的请求报头。源码:Request(请求地址):这个方法可以自己构建请求报头，Rquest方法有两个参数。参数1是请求地址，参数...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。