from urllib.request import urlopen
import re
html=urlopen(
"https://morvanzhou.github.io/static/scraping/basic-structure.html"
).read().decode('utf-8')
print(html)
res=re.findall(r'<title>(.+?)</title>',html)#+或者*差距不大
print("\n title",res[0])
res2=re.findall(r'href="(.*?)"',html)
print("href",res2)
第一个爬去 title
第二个爬去 链接