一urllib库与urllib2库
urllib库与urllib2库是python中内置的HTTP请求库,urllib模块提供的上层接口,是访问的www和ftp上的数据就像是访问本地文件一样
二 urllib
有以下几种模块
1.urllib.request 请求模块
urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)
url:需要打开网址, data:Post提交数据,默认为None, 当data不为None时,urlopen()提交方式为Post timeout:设置网站访问超时时间
2. urllib.error 异常处理模块
3. urllib.parse url 解析模块
4. urllib.robotparser robots.txt 解析模块
三 区别
在python2中urllib与urllib2是分开的,在python3中把urllib2合并在了urllib里面
urllib2可以接受一个request类的实例来设置URL请求的headers,urlib仅可以接受URL。这意味着,你可以通过urllib模块来伪装你的User Agent字符串等(伪装浏览器)
urllib提供urlencode方法用来GET查询字符串的产生,而urllib2没有,这是为何urllib常和urllib2一起使用的原因
在python3中,urllib2分成了urllib.request和urllib.error模块,在使用的时候需要把urllib2.xxx改成urllib.request.xxx