Python爬虫（二、urllib2的urlopen方法和Request请求对象）

最新推荐文章于 2024-04-23 16:42:17 发布

tao3741

最新推荐文章于 2024-04-23 16:42:17 发布

阅读量8.8k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tao3741/article/details/75207879

版权

1、urlopen：不能伪装成一个浏览器。

url:(统一资源定位符)要访问的url地址：

data：表示要往网页中传输的内容，即post请求。

timeout 设置过期时间，默认是180s.如果网页

import urllib2

def urlopen():

response = urllib2.urlopen('http://www.baidu.com')

html = response.read()

print html

if __name__ == '__main__'

urlopen()

response想用是一个类文件对象。

response.read():读取文件所有内容，返回字符串。

if __name__ == '__main__'

只有在本文件调用的时候，才执行

当urlopen 不能够处理一个response时。产生urlError.通常URLError在没有网络连接，或者服务器不存在的情况下产生，异常会带有‘reason属性’，是衣蛾不可变的数组，包含一个错误号和一个错误信息。

2、urllib2用一个Request对象来映射提出的http请求，。其最简单的使用方式是把要请求的地址创建一个Request对象通过调用URLopen并传入Request对象，将返回一个相关请求response对象。可以在response中用.read().

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫（二、urllib2的urlopen方法和Request请求对象）

1、urlopen：不能伪装成一个浏览器。url:(统一资源定位符)要访问的url地址data：表示要往网页中传输的内容，即post请求。timeout 设置过期时间，默认是180s.如果网页import urllib2def urlopen():response = urllib2.urlopen('http://www.baidu.com')html
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。