做个小项目练练手,比较有动力继续下去,这边参考最简单的爬虫程序自己抄了一下。但是因为3.0的关系,无法直接使用,根据2.0版本的代码进行修改后成功了。
代码如下:
# -*- coding: utf-8 -*-
# 网上抄来的最简单的爬虫,用于批量下载图片
import urllib.request
import re
#该函数用于获取html内容
#使用到urlopen的函数
def getHtml(url):
page = urllib.request.urlopen(url)
#3.0直接使用read()函数会出现报错,提示是编码有问题。在后面加上编码就ok了。
html = page.read().decode("utf-8")