python核心模块--urllib

最新推荐文章于 2017-06-07 21:13:52 发布

进击的编程小菜鸟

最新推荐文章于 2017-06-07 21:13:52 发布

阅读量286

点赞数

分类专栏： python 2016年5月

2016年5月同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

python

16 篇文章 1 订阅

订阅专栏

2016/4/28【学习笔记】

习惯留一个原博文章学习地址》》》http://www.cnblogs.com/sysu-blackbear/p/3629420.html

urlopen返回对象提供方法：

- read() , readline() ,readlines() , fileno() , close() ：这些方法的使用方式与文件对象完全一样

- info()：返回一个httplib.HTTPMessage对象，表示远程服务器返回的头信息

- getcode()：返回Http状态码。如果是http请求，200请求成功完成;404网址未找到

- geturl()：返回请求的url

1.readline()使用

#readline实例
# -*- coding: UTF-8 -*-
import urllib

def getHtml(url):
    f = urllib.urlopen(url)#打开网页
    getline = f.readline()  #读取第一行
    return getline

print getHtml('http://www.baidu.com/')

2.urlretrieve()

urllib.urlretrieve(url[, filename[, reporthook[, data]]])
参数说明：
url：外部或者本地url
filename：指定了保存到本地的路径（如果未指定该参数，urllib会生成一个临时文件来保存数据）；
reporthook：是一个回调函数，当连接上服务器、以及相应的数据块传输完毕的时候会触发该回调。我们可以利用这个回调函数来显示当前的下载进度。
data：指post到服务器的数据。该方法返回一个包含两个元素的元组(filename, headers)，filename表示保存到本地的路径，header表示服务器的响应头。

import urllib
def callbackfunc(blocknum, blocksize, totalsize):
    '''回调函数
    @blocknum: 已经下载的数据块
    @blocksize: 数据块的大小
    @totalsize: 远程文件的大小
    '''
    percent = 100.0 * blocknum * blocksize / totalsize
    if percent > 100:
        percent = 100
    print "%.2f%%"% percent
url = 'http://www.sina.com.cn'
local = 'd:\\sina.html'
urllib.urlretrieve(url, local, callbackfunc)

3.urlcleanup()

清除由于urllib.urlretrieve()所产生的缓存

4.urllib.quote() 和urllib.quote_plus()

>>> urllib.quote('http://www.baidu.com')
'http%3A//www.baidu.com'
>>> urllib.quote_plus('http://www.baidu.com')
'http%3A%2F%2Fwww.baidu.com'

5.urllib.unquote()和urllib.unquote_plus()

与4相反

6.urllb.urlencode(query)

将URL中的键值对以连接符&划分

这里可以与urlopen结合以实现post方法和get方法：

get方法：

>>> import urllib
>>> params=urllib.urlencode({'spam':1,'eggs':2,'bacon':0})
>>> params
'eggs=2&bacon=0&spam=1'
>>> f=urllib.urlopen("http://python.org/query?%s" % params)
>>> print f.read()

post方法：

>>> import urllib
>>> parmas = urllib.urlencode({'spam':1,'eggs':2,'bacon':0})
>>> f=urllib.urlopen("http://python.org/query",parmas)
>>> f.read()

进击的编程小菜鸟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python核心模块--urllib

2016/4/28【学习笔记】习惯留一个原博文章学习地址》》》http://www.cnblogs.com/sysu-blackbear/p/3629420.htmlurlopen返回对象提供方法：- read() , readline() ,readlines() , fileno() , close() ：这些方法的使用方式与文件对象完全一样-
复制链接

扫一扫

专栏目录