使用Python爬取网页中html内容
命令详解:# coding=utf-8 import urllib import urllib2 import re url = "http://3ms.huawei.com/km/blogs/details/5171043" request = urllib2.Request(url) page = urllib2.urlopen(url) html = page.read() print html
urlopen()可以接收三个参数即urlopen(url, data, timeout)
url即你要请求的url地址,data是访问这个url需要传送的数据,timeout是超时时间
url是必填参数,其余两个是可选参数
urllib.request.urlopen(url)会返回一个http.client.HTTPResponse对象
这个返回的对象可以使用read()方法,来返回数据