目录
Python2.x中
urllib和urllib2
urllib 和 urllib2 是 python2.x 自带的模块,提供了一系列用于操作URL的功能。
urllib 和 urllib2 都是接受URL请求的相关模块,但是urllib2可以接受一个Request类的实例来设置URL请求的 headers,urllib 仅可以接受URL。这意味着,urllib不可以伪装你的User Agent 字符串等。
但是 urllib 提供 urlencode 方法用来对数据进行url编码,而 urllib2 没有,所以 urllib 经常和 urllib2 一起使用。
常用方法和类
urllib2.urlopen( url [, data] [, timeout] )
urlopen方法是urllib2模块最常用也最简单的方法,它打开URL网址。调用urlopen函数对请求的url返回一个response对象。这个response类似于一个file对象,所以用 .read() 函数可以操作这个response对象
- url 参数可以是一个字符串 url 或者是一个Request对象。url 必须是 http:// 的格式
- 对于可选参数 data,表示以 post 方式提交到 url 的数据。不填则为 g