第5章 网页下载器和urllib2模块

网页下载器:将互联网上URL对应的网页下载到本地的工具

通过网页下载器将互联网中的url网页,存储到本地或内存字符串

 

python有哪几种网页下载器?

1.urllib2  python官方基础模块

2.requests   python第三方包更强大

urllib2下载网页方法1:最简洁方法

  url-------------------------->urllib2.urlopen(url)

代码:

import urllib2

/#直接请求

response = urllib2.urlopne('http://www.baidu.com');

/#获取状态码,如果200表示获取成功

print.response.getcode();

/#读取内容

cont = response.read();

方法2:data、http、header

代码:

import urllib2;
#创建Request对象
request = urllb2.Request(url)
#添加数据
request.add_data('a','a')
#添加http的header
request.add_header('User-Agent','Mozilla/5.0')
#发送请求获取结果
response = urllib2.urlopen(request)

方法三:添加特殊情景的处理器

import urllib2,cookielib
#创建cookie容器
cj = cookielib.CookieJar()
#创建1个opener
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
#给urllib2安装opener
urllib2.install_opener(opener)
#使用带有cookie的urllib2访问网页
response = urllib2.urlopen('http://www.baidu.com')

 

转载于:https://www.cnblogs.com/Worssmagee1002/p/7359551.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值