爬虫爬取网页错误：UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 318

最新推荐文章于 2023-06-28 15:19:58 发布

JiangNGU

最新推荐文章于 2023-06-28 15:19:58 发布

阅读量1.9k

点赞数 6

分类专栏：爬虫学习

本文链接：https://blog.csdn.net/qq_41243742/article/details/104715077

版权

爬虫学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在爬虫爬取网页的html源码写入文件

import requests

# 定义get请求
url = 'https://www.baidu.com/'

# 发起get请求
res = requests.get(url=url)

# 获取响应代码
code = res.status_code
print(code)

# 响应成功后把网页内容写入文件中
if code == 200:
    with open('./test.html','w') as fp:
        fp.write(res.text)

错误信息

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xe7’ in position 318: illegal multibyte sequence，中文翻译为UnicodeEncodeError：‘gbk’编解码器无法在位置318中编码字符’\ xe7’：非法的多字节序列