爬虫
ZJE_ANDY
这个作者很懒,什么都没留下…
展开
-
Python3爬虫(一)抓取网页的html
因为代码只有几行,所以可以先贴代码:import urllib.requesturl = r'http://douban.com'res = urllib.request.urlopen(url)html = res.read().decode('utf-8')print(html)第一行,导入 urllib库的request模块第二行,指定要抓取的网页url,必须以http原创 2017-02-03 18:28:11 · 45014 阅读 · 2 评论 -
Python3爬虫(二)保存抓取网页的html
1.查看网页的头部信息以确定网页的编码方式:import urllib.requestres = urllib.request.urlopen('http://www.163.com')print(res.info()) #in原创 2017-06-19 12:15:05 · 5818 阅读 · 0 评论