完美解决Python的UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\x等‘ in position 0:报错问题

~贝母~

已于 2023-05-23 07:05:05 修改

阅读量3.3k

点赞数 2

分类专栏： python爬虫文章标签：经验分享 python

于 2022-01-13 15:04:51 首次发布

本文链接：https://blog.csdn.net/m0_62945506/article/details/122473875

版权

python爬虫专栏收录该内容

14 篇文章 1 订阅

订阅专栏

最近好几个项目的实战都遇到了这个问题，查阅了不少资料，博客，一开始用到的解决方法是：

        demo = open(r"demo.txt", "r", encoding="utf-8")
        soup = BeautifulSoup(demo.read(), 'html.parser')
        html_data = soup.find('div', id="J_goodsList")

采用最原始的写入文件，重新读取文件

后面发现了个更简便的方法：

text.replace('\xaf','')

让pycharm在输出遇到改字符的时候替换为空，以解决该问题

但是昨天我遇到了一个html原码里面竟然存在多个这样的字符，这可把我头疼的啊，

于是我开始尝试使用捕获：

try:
    print(text.replace('\xaf',''))
except UnicodeEncodeError:
    continue

虽然解决问题了但是发现这样少输出了不少东西，就很难受，今天早上查阅了更多的资料和博客，发现有了两全其美的方法：

在pycharm的文件编码里可以设置，给自己的无语操作给整笑了，就这吧

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

~贝母~

关注关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

UnicodeEncodeError:‘gbk‘ codec can‘t encode character ‘\xa9‘ in position 1363:illegal multibyte 解决方案

weixin_43178406的博客

08-03

5万+

本文主要介绍了UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa9’ in position 1363: illegal multibyte sequence解决方案，希望能对使用Python的同学们有所帮助。文章目录 1. 问题描述 2. 解决方案

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 141: illegal multibyte

最新发布

LDC，公众号【轻松学编程】

03-31

157

'gbk' codec can't encode character '\xa0' in position 141: illegal multibyte sequence

1 条评论您还未登录，请先登录后发表或查看评论

Python3 解决编码问题： `UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: ille

AoboSir.com

11-26

3万+

Python3 解决编码问题： UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: illegal multibyte sequence — 当执行爬虫将爬取信息打印到终端时出现的编码错误 Python 版本：python-3.5.0-amd64 目标网站：http://blog.csdn.ne

UnicodeEncodeError: 'gbk' codec can't encode character '\ufeff' in position 0: illegal multibyte seq

name_z的专栏

07-31

1万+

使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position … 这个问题。网络上有很多类似的文件讲述如何解决这个问题，但是无非就是encode，decode相关的，这是导致该问题出现的真正原因吗？不是的。很多时候，我们使用

Python---UnicodeEncodeError: 'gbk' codec can't encode character '\xff' in position 0: illegal multib

Milkha的博客

07-20

1640

在Python中，可以对String调用decode和encode方法来实现转码。比如，若要将某个String对象s从gbk内码转换为UTF-8，可以如下操作 s.decode(‘gbk’).encode(‘utf-8′) 可是，在实际开发中，我发现，这种办法经常会出现异常： UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in...

解决UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 0问题

abcdasdff的博客

08-15

1万+

在Python中将网址写入文件的时候，会碰到：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position 0这个问题。其实就是在windows中，新建的文本文件的默认编码是gbk. 如此,我们可以在程序中提前指定编码就可以了. 而utf-8通用,就选它了 ……. f = open(‘a.txt’,...

Python报错：UnicodeEncodeError 'gbk' codec can't encode character

weixin_30564901的博客

01-08

726

今天在使用Python文件处理写网络上爬取的文件的时候，遇到了错误：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position … 这个问题。代码： import urllib.request #等价与from urllib import request response = urllib.r...

Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法

09-22

当尝试将网络数据流（如网页内容）写入到本地文件时，经常会遇到错误提示：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position XXX，这表明在编码转换过程中出现了问题。编码问题的根源...

Python UnicodeEncodeError: ‘gbk’ codec can’t encode character 解决方法

12-25

使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position … 这个问题。网络上有很多类似的文件...

【解决新手爬虫 python3】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘‘ in position

weixin_43052741的博客

08-31

1504

解决新手爬虫遇到的UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 7084: illegal multibyte sequence

UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque

nemo2011的专栏

03-18

2万+

html = response.read() str_html = html.decode() f = open('baidu.html', 'w+') for values in str_html: f.write(values) f.close() 上面代码编译的时候出现了：Un...

【UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa5’ in position 0: illegal multibyte seq】

simpleness_的博客

02-24

480

报错信息为：UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa5’ in position 0: illegal multibyte sequence 报错信息解决方法：要在with open里添加encoding=“utf-8”

python爬取网页UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in posi

younger_to_older的博客

08-07

770

（1）爬取网页代码格式问题 def get_html(url): try: response = requests.get(url) if response.status_code == 200: return response.text ...... return get_html(url) ...

报错UnicodeEncodeError: ‘gbk’ codec can’t encode character

雪山飞狐

06-12

4079

用Python将网络数据写入本地时，使用open后，报错UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xef’ in position 25642: illegal multibyte sequence，是因为解码编码不同所导致的。根据这位大神的方法，顺利解决了问题，讲解非常简洁易懂。简言之，就是在代码中加入指定encode：...

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 67008: illegal multibyte s

fly_wugui的博客

09-10

2937

【编码】UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position XXX

西门一刀的博客

01-02

912

有时候在win中运行代码会遇到题目中的报错问题: “UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’ in position XXX”,让人摸不着头脑的是程序开头的编码设置# coding:utf-8 和数据流IO操作时的编码转化都已经在程序中加入加入了。gbk哪里来的呢？其实就是win中新文件的默认编码是gbk。当我们遇到编码问题的时候，有三个地方需要注意的:文件的编码，IDE的编码，还有数据流IO操作过程中的编码。后面两种很多

解决UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 5: illegal multibyte 问题

scwMason的博客

01-20

3372

这个是我在准备用HTMLParser解析一段html的时候出错的，在网上查了一下，原来是print()函数自身有限制，不能完全打印所有的unicode字符，所以只要规定一下print的打印的默认编码就行了： import io import sys import urllib.request sys.stdout = io.TextIOWrapper(sys.stdout.buffer,enc...

真正解决Windows下UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xff in position 0错误的方法

热门推荐

mighty13的专栏

07-05

10万+

问题现象：在Windows下使用Python读文件时，经常遇到UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence错误。在open函数参数中设置encoding='utf-8'也不能解决问题，会出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid sta

Python报错： UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position xxx

a_xixi的博客

07-06

789

刚接到一个需求是要取出所有i18n文件下的en，zh文件，所涉及的文件目录比较多复制太浪费时间了，所以自己写了一个小方法，以下是代码： path = 'C:/Users/ywx547757/Desktop/bug-code/cpts_console_ui/cpts2.0/src' fs = open("D:\yuan\py/test-zh.txt","w" ,encoding='utf-8')...

UnicodeEncodeError: gbk codec can t encode character \ue253 in position 636: illegal multibyte sequence

07-27

引用\[1\]、\[2\]和\[3\]提供了关于UnicodeEncodeError报错的解决方法。这个错误通常是由于编码问题引起的，即在使用gbk编码时，遇到了无法编码的字符。解决这个问题的方法是将文件编码改为UTF-8。这可以通过在PyCharm中修改文件编码来实现。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [已解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘ŗ‘ in position 1: illegal ...](https://blog.csdn.net/yuan2019035055/article/details/126582320)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte...](https://blog.csdn.net/qq_59544594/article/details/127222466)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [解决python中的UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u26ab‘问题](https://blog.csdn.net/m0_56636447/article/details/127637293)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]