python urllib 模块使用小结

本文介绍了Python内置的urllib模块,涵盖urlopen、urlretrieve等核心函数的使用方法,以及quote/unquote和urlencode等数据编码工具。通过实例演示,帮助读者快速掌握处理Web数据的高效编程技巧。
摘要由CSDN通过智能技术生成

python urllib 模块使用小结

urllib 提供了一个高级的 Web 交流库,支持 Web 协议,HTTP, FTP 和 Gopher 协议,同时也支持对本地文件的访问。urllib 模块的特殊功能是利用上述协议下载数据。使用这个模块可以避免使用httplib,ftplib 和 gopherlib 这些模块,除非你想用更低层的功能。
安装:

pip install urllib

功能包括 urlopen(), urlretrieve(), quote(),unquote(), quote_plus(), unquote_plus(), 和 urlencode() 等。

函数urlopen()
功能打开一个给定 URL 字符串与 Web 连接,并返回了文件类的对象
语法结构urlopen(urlstr, postQueryData=None)
说明urlopen()打开 urlstr所指向的 URL。如果没有给定协议或者下载规划,或者文件规划早已传入,urlopen()则会打开一个本地的文件。一旦连接成功,urlopen() 将会返回一个文件类型对象,就像在目标路径下打开了一个可读文件。支持可读方法如:f.read(), f.readline(), f.readlines(), f.close(),和 f.fileno()

函数urlretrieve()
功能将 urlstr 定位到的整个HTML 文件下载到你本地的硬盘上
语法结构urlretrieve(urlstr, localfile=None, downloadStatusHook=None)
说明urlretrieve()返回一个 2-元组,(filename, mime_hdrs).filename 是包含下载数据的本地文件名,mime_hdrs 是对Web 服务器响应后返回的一系列 MIME 文件头。要获得更多的信息,可以看mimetools 的 Message 类。对本地文件来说 mime_hdrs 是空的。

函数quote() / quote_plus()
功能获取 URL 数据,并将其编码,从而适用于 URL 字符串中
语法结构quote(urldata, safe=’/’)
说明逗号,下划线,句号,斜线和字母数字这类符号是不需要转化。其他的则均需要转换。当调用 quote*()时,urldata 字符串被转换成了一个可在 URL 字符串中使用的等价值。quote_plus 可以将空格编码成+号

函数unquote() / unquote_plus()
功能将所有编码为“%xx”式的字母都转换成它们的 ASCII 码值
语法结构unquote(urldata)
说明调用 unquote()函数将会把 urldata 中所有的 URL-编码字母都解码,并返回字符串。Unquote_plus()函数会将加号转换成空格符。

函数urlencode()
功能接收字典的键-值对,并将其编译成 CGI 请求的 URL 字符串的一部分。键值对的格式是“键=值”,以连接符(&)划分。
语法结构
说明
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值