跟着B站视频第一次学习爬虫 果不其然 失败 下面是我的代码
from urllib.request import urlopen
url = "https://www.baidu.com/index.php?tn=monline_3_dg"
resp = urlopen(url)
with open("mybaidu.html", mode="w", encoding="utf-8")as f:
f.write(resp.read().decode("utf-8"))
print("over~")
我的失败mybaidu.html
<html>
<head>
<script>
location.replace(location.href.replace("https://","http://"));
</script>
</head>
<body>
<noscript><meta http-equiv="refresh" content="0;url=http://www.baidu.com/"></noscript>
</body>
</html>
方法 方法 方法:
将 url 中的 https 改成 http 一切迎刃而解
补充 如果代码 withopen中这样写:
with open("mybaidu2.html", mode="w")as f:
f.write(resp.read().decode("utf-8"))
那么结果就会变成:
所以说 encoding="utf-8" 很必要~