# coding=utf-8
import urllib.request
import re
url = 'http://www.163.com'
file = 'd:/test.html'
data = urllib.request.urlopen(url).read()
r1 = re.compile('<.*?>')
c_t = r1.findall(data)
print(c_t)
发现读取下来后,运行到第9 行,出现:
can’t use a string pattern on a bytes-like object
查找了一下,是说3.0现在的参数更改了,现在读取的是bytes-like的,但参数要求是chart-like的,找了一下,加了个编码:
data = data.decode(‘utf-8’)
在与正则使用前,就可以正常使用了..