21.6 urllib2-extensible library for opening URLs
urllib2 模块定义函数和类帮助打开一个复杂的 URL- 基本的和分析授权,重定向, cookies 等等。
urllib2 模块定义了下面的函数:
urllib2.urlopen(url[,data][,timeout])
打开 url, 既可以是一个字符串也可以是一个 request 对象。
data 可能是一个指定特殊数据到服务器的字符串,或者 None. 当前只有 HTTP 请求使用 data ;当 data 参数给出了, HTTP 请求将是一个 POST 而不是 GET 。 data 应该是标准 application/x-www-form-urlencoded 格式的缓冲。 urllib.urlencode() 函数接收一个映射或 2 元组并返回该种格式的字符串。
timeout 参数制定一个 timeout 秒数来中断连接尝试。只对 HTTP , HTTPS , FTP 和 FTPS 连接有效。
该函数返回类似文件的对象和两个额外的方法:
geturl()- 返回抓取的 URL 资源,通常用来确定是否有重定向。
info()- 返回网页的元信息,例如 headers ,格式为 httplib.HTTPMessage
抛出 URLError 作为错误类型。
注意 None 会返回如果没有句柄处理请求(尽管默认的 global OpenerDirector 使用 UnknownHandler 确保这种情况不可能发生)
而且,默认的 ProxyHandler 通过代理来保证请求被处理。
Changed in version 2.6: timeout was added.
urllib2.install_opener ( opener )