Python爬取百度网页时出现的编码问题

^z南野

已于 2023-07-04 16:55:47 修改

阅读量432

点赞数 2

分类专栏： Python 文章标签： python 开发语言

于 2023-07-01 21:49:04 首次发布

本文链接：https://blog.csdn.net/qq_58299429/article/details/131494956

版权

Python 专栏收录该内容

1 篇文章

订阅专栏

下面是我没有修改的代码

from urllib.request import urlopen

url = "http://www.baidu.com"

resp = urlopen(url)
with open("mybaidu.html", mode="w") as f:
    f.write(resp.read().decode("utf-8"))

运行后出现了乱码

解决办法，使用UTF-8编码方式来处理字符串或文件的读写操作。

from urllib.request import urlopen

url = "http://www.baidu.com"

resp = urlopen(url)

# encoding="utf-8"表示将使用UTF-8编码方式来处理字符串或文件的读写操作。
# decode("utf-8")将这些字节字符串解码为Unicode字符串，使用的编码方式是UTF-8
with open("mybaidu.html", mode="w", encoding="utf-8") as f:     
    f.write(resp.read().decode("utf-8"))