urllib.urlopen(url[, data[, proxies]]) : ##获取给定地址页面信息
url 要获取内容的页面地址
data -----web方法POST/GET
proxies 使用代理
urlopen()返回一个文件对象,所以文件相关的操作都支持:
read() , readline() , readlines() , fileno() , close() 。
info():返回一个httplib.HTTPMessage 对象,表示远程服务器返回的头信息。
getcode():返回Http状态码,200表示请求成功完成;404表示网址未找到。
geturl():返回请求的url。
urllib.urlretrieve(url[, filename[, reporthook[, data]]]):
url 需要下载的页面地址。
filname 要保存到的本地文件。
reportthook 参数reporthook是一个回调函数,当连接上服务器、以及相应的数据块传输完毕的时候会触发该回调。我们可以利用这个回调函 数来显示当前的下载进度。
data 参数data指post到服务器的数据。
urllib.quote(string[, safe]):对字符串进行编码。参数safe指定了不需要编码的字符。
urllib.unquote(string) :对字符串进行解码。
urllib.quote_plus(string [ , safe ] ) :与urllib.quote类似,但这个方法用'+'来替换' ',而quote用'%20'来代替' '。
urllib.unquote_plus(string ) :对字符串进行解码。
urllib.urlencode(query[, doseq]):将dict或者包含两个元素的元组列表转换成url参数。例如 字典{'name': 'dark-bull', 'age': 200}将被转换为"name=dark-bull&age=200"。
urllib.pathname2url(path):将本地路径转换成url路径。
urllib.url2pathname(path):将url路径转换成本地路径。