python学习之urllib模块

最新推荐文章于 2021-11-27 15:36:56 发布

chengwa6790

最新推荐文章于 2021-11-27 15:36:56 发布

阅读量121

点赞数

文章标签： python

原文链接：https://my.oschina.net/u/1173197/blog/294812

版权

url 要获取内容的页面地址

data -----web方法POST/GET

proxies 使用代理

urlopen()返回一个文件对象，所以文件相关的操作都支持：

read() , readline() , readlines() , fileno() , close() 。

info()：返回一个httplib.HTTPMessage 对象，表示远程服务器返回的头信息。

getcode()：返回Http状态码，200表示请求成功完成;404表示网址未找到。

geturl()：返回请求的url。

url 需要下载的页面地址。

filname 要保存到的本地文件。

reportthook 参数reporthook是一个回调函数，当连接上服务器、以及相应的数据块传输完毕的时候会触发该回调。我们可以利用这个回调函数来显示当前的下载进度。

data 参数data指post到服务器的数据。

urllib.quote(string[, safe])：对字符串进行编码。参数safe指定了不需要编码的字符。
urllib.unquote(string) ：对字符串进行解码。
urllib.quote_plus(string [ , safe ] ) ：与urllib.quote类似，但这个方法用'+'来替换' '，而quote用'%20'来代替' '。
urllib.unquote_plus(string ) ：对字符串进行解码。
urllib.urlencode(query[, doseq])：将dict或者包含两个元素的元组列表转换成url参数。例如字典{'name': 'dark-bull', 'age': 200}将被转换为"name=dark-bull&age=200"。
urllib.pathname2url(path)：将本地路径转换成url路径。
urllib.url2pathname(path)：将url路径转换成本地路径。