获取页面内容的基本步骤
from urllib import request
# 第一个要发起请求的url地址
base_url = 'http://www.baidu.com'
# 打开url,获取响应
response = request.urlopen(base_url)
# 读取页面内容
html = response.read().decode()
# print(html)
# 建立文件,并将HTML内容写入
with open('baidu.html','w',encoding='utf-8') as f:
f.write(html)