需要用到Python的内置库urllib,使用这个库可以向服务器发送请求获得网页
import urllib.request #导入urllib库
爬取网页数据时一般使用request属性
response = urllib.request.urlopen('网页地址') #打开你输入的网页地址的网页
result = response.read().decode('utf-8') #将爬取的网页HTML读出来,decode方法将读取的数据解码,避免乱码
print(result) #打印数据
info = response.info()#获取地址header信息
print(info)
code = response.getcode()#获取访问地址的HTTP状态码
print(code)