Python的学习（十九）--获取网页信息（一）

最新推荐文章于 2023-12-20 16:13:32 发布

python資深小白

最新推荐文章于 2023-12-20 16:13:32 发布

阅读量2.3w

点赞数

分类专栏： python 文章标签： python Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linda1000/article/details/8558929

版权

本文介绍了Python的urllib2模块，用于获取URL信息。相较于urllib，urllib2功能更全面，实用性更强。通过创建Request对象，结合urlopen函数，可以实现HTTP请求，包括GET和POST方式，以及设置请求头模拟浏览器行为。同时，文章还提到了异常处理，如URLError和HTTPError，并解释了如何获取HTTP响应的状态码和信息。

摘要由CSDN通过智能技术生成

用python越久，感觉python的封装的模块很多，也很实用。

最近尝试用python脚本去获取url页面信息，网上可以查到的基本都是用urllib / urllib2 模块，

只是简单对比了两种模块，感觉urllib2的功能更全面，实用性更强，决定用urllib2来实现，

urllib2是python的一个获取url的组件，以urlopen函数的形式提供了一套接口，具有利用不同协议获取url的能力

若简单的访问网页，例如：

import urllib2

response = urllib2.urlopen('http://www.baidu.com')

html = response.read()

HTTP是基于请求和应答机制的，即客户端提出请求，服务端提供应答。urllib2用一个Request对象来映射所发出的HTTP请求

例如根据请求的url地址创建一个Request对象，通过调用urlopen并传入Request对象，例如：

import urllib2

req = urllib2.Request('http://www.baidu.com')

response = urllib2.urlopen(req)

html = response.read()

在HTTP请求时，允许做额外的两件事，首先是发送data表单数据，其次是能够传送额外的关于数据或发送本身的信息到服务器，此数据作为HTTP的‘headers’来发送

对于表单数据，在HTTP中，经常使用PO

最低0.47元/天解锁文章

python資深小白

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。