2020年,坚持好好学习Python爬虫记录学习笔记
向目标网站发起请求,并且读取源码。其中用到urllib 库
最后把网站源码保存到本地,代码如下:
import urllib.request
url = "http://m.sinovision.net/newpneumonia.php"
res = urllib.request.urlopen(url)
print(res.status)
print(res.geturl())
print(res.getcode())
print(res.info())
# print(res.read())
web = res.read().decode("utf8")
print(web)
f = open("html",mode="w",encoding="utf8")
f.write(web)
f.flush()
f.close()
res.status 获取状态码
res.geturl()获取url
res.info() 获取响应头
res.getcode()获取状态码
res.read().decode(“utf8”) 用utf8 代码读取