urllib是Python标准库的一部分,包含urllib.request,urllib.error,urllib.parse,urlli.robotparser四个子模块,这里主要介绍urllib.request的一些简单用法.
首先是urlopen函数,用于打开一个URL:
# -*- coding:utf-8 -*- #获取并打印google首页的html
import urllib.request
response=urllib.request.urlopen('http://www.google.com')
html=response.read()
print(html)
urlopen返回一个类文件对象,可以像文件一样操作,同时支持一下三个方法:
read() , readline() , readlines() , fileno() ,close() :这些方法的使用方式与文件对象完全一样;
· info():返回一个对象,表示远程服务器返回的头信息。
· getcode():返回Http状态码,如果是http请求,200表示请求成功完成;404表示网址未找到。
· geturl():返回请求的url地址。