Python爬虫学习（1）

最新推荐文章于 2024-08-07 08:19:34 发布

qq_2773878606

最新推荐文章于 2024-08-07 08:19:34 发布

阅读量427

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_18343569/article/details/79264478

版权

python 专栏收录该内容

61 篇文章 0 订阅

订阅专栏

使用Python爬取网页中html内容

# coding=utf-8
import urllib
import urllib2
import re
url = "http://3ms.huawei.com/km/blogs/details/5171043"
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html
命令详解：

urlopen()可以接收三个参数即urlopen(url, data, timeout) 
url即你要请求的url地址，data是访问这个url需要传送的数据，timeout是超时时间 
url是必填参数，其余两个是可选参数 
urllib.request.urlopen(url)会返回一个http.client.HTTPResponse对象 
这个返回的对象可以使用read()方法，来返回数据