Python标准库获取HTML资源之urllib2

我们平时通过浏览器可以从URL中获取相应的资源并展示出来,但是很多时候我们只是需要对获取的html资源进行特定的处理,就用到了python的urliib,urllib2和httplib等标准库

urllib2用于编写需要和http服务器,ftp服务器和本地文件交互的客户端;典型的应用程序有:抓取网页数据,代理,web爬虫等
1.使用urlopen()发生请求,获取HTTP资源
urlopen(url[, data[, timeout]])

参数解释:

url:可以是包括URL的字符串,也可以是Request类的实例(下面会讲到);
data:是使用urlencode()方法进行编码后的查询数据,常见的如填写一网页的表单数据,然后进行编码赋值给data,传入urlopen()函数;
timeout:顾名思义就是超时时间的设置
urlopen()函数返回类文件对象,先暂时记为u,支持下列方法:
u.read([nbytes]):以字节字符串形式读取nbytes个数据
u.readline(): 以字节字符串形式读取但行文本
u.readlines(): 读取所有输入行并返回列表
u.close()
u.geturl(): 返回实际的url,因为有可能发生重定向问题

u.getcode(): 获取HTTP响应代码

其中最常见的HTTP响应代码有
1

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值