【已解决】Python: 'gbk' codec can't encode character u'\xxx'

最新推荐文章于 2024-08-14 15:01:32 发布

亲亲Friends

最新推荐文章于 2024-08-14 15:01:32 发布

阅读量1w

点赞数 4

分类专栏： Python 文章标签： python gbk unicode 编码

本文链接：https://blog.csdn.net/u014261408/article/details/90085162

版权

Python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

问题

用Python抓取网页，保存为myWeb

然后将网页解码为Unicode：

myUnWeb=myWeb.decode(‘utf-8’)

然后用正则表达式处理：处理过程略，得到myUnWebItems

然后print：

print myUnWebItems;

出现如下错误：

exception raised: ‘gbk’ codec can’t encode character u’\xa0’ in position 73: illegal multibyte sequence

解决过程

比较艰苦，差点儿放弃，不忍吐槽，略去数万字

问题原因

对于此Unicode字符(myUnWebItems)，需要print出来的话，由于本地系统是Windows中的cmd，默认codepage是CP936，即GBK的编码，所以python解释器需要先将上述的Unicode字符myUnWebItems编码为GBK，然后再在cmd中显示出来。

但是由于myUnWebItems中包含一些GBK中无法显示的字符，导致此时提示’gbk codec can’t encode的错误。

解决办法

方案1

在对unicode字符编码时，添加ignore参数，忽略无法无法编码的字符，这样就可以正常编码为GBK了。对应代码为：

print myUnWebItems.encode(“GBK“, ‘ignore’);

方案2

或者，将其转换为GBK编码的超集GB18030 （即，GBK是GB18030的子集）：

print myUnWebItems.encode(“GB18030“);

对应的得到的字符是GB18030的编码。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

亲亲Friends

关注关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python3中文输出，解决python3 UnicodeEncodeError: gbk codec cant encode character \xXX in position XX

pyjavacsql的博客

05-22

677

python3中文输出，解决python3 UnicodeEncodeError: gbk codec cant encode character 找了很久才发现原因是python3的print()函数调用的是系统默认的控制台输出，而windows系统默认的控制台输出的编码是GBK，也就是CP936 代码中加入： import sys,io sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码 ...

Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法,需要的朋友可以参考下

￥￥￥的博客

08-29

1261

最近研究用聚类算法实现日志的分类，在得到结果后准备将结果写入到指定文本是出现了这样的错误：经过网上多次查询得到了解决方案：就是在打开一个文本准备写入的同时同样要指定一下字符集。这样他就会以同样的字符集打开你要分析的文本。总结：使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: 'gbk' codec...

3 条评论您还未登录，请先登录后发表或查看评论

【Python解决】第1讲函数基础篇编写爬虫：提示‘gbk‘ codec can‘t encode character ‘\ue759‘ in position 270720

a272329874a的博客

05-23

462

2. 修改 File Encodings 编码为 UTF-8。3. 执行完美解决问题。

Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法

09-22

主要介绍了Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法,需要的朋友可以参考下

python在写入文件时出现“‘gbk‘ codec can‘t encode character”有效解决方法！！！

热门推荐

小米的博客

11-21

4万+

使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。网络上有很多类似的文件讲述如何解决这个问题，但是无非就是encode，decode相关的，这是导致该问题出现的真正原因吗？不是的。很多时候，我

Python中‘gbk‘ codec can‘t encode character解决方法

PlutoZuo的博客

10-14

6097

Python中‘gbk‘ codec can‘t encode character解决方法

Python写入文件报错‘gbk’ codec can’t encode character的解决办法

翎野君的博客

06-03

4533

背景使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。网络上有很多类似的文件讲述如何解决这个问题，但是无非就是encode，decode相关的，这是导致该问题出现的真正原因吗？不是的。很多...

Python: 'gbk' codec can't encode character '\u30fb' in position 0: illegal multibyte sequence

zoulonglong的博客

11-22

1万+

先上代码：代码是通过爬去王者荣耀官方网站的数据，然后再写入文件中，获取的英雄，铭文等信息写入时都没有问题，但是写入装备信息时就出现编码的问题了 # -*- coding: utf-8 -*- """ Created on Thu Nov 16 16:25:44 2017 @author: 10183930 """ import requests import csv import...

PYTHON3解决'gbk' codec can't encode character '\xXX' in position XX

yq0632的博客

05-09

2万+

之前写了个爬虫获取一些公司公开的信息，但是在往TXT文件写入的时候偶尔会报错'gbk' codec can't encode character '\xXX' in position XX。在网上查了许久都是说因为print()输出的缺陷，但是自己测试之后发现并非如此。我在python3环境中，使用的开发程序是Pycharm，这应该不会出现那种错误才对，于是...

Python中出现UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u2022’

12-21

UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u2022’ in position 7: illegal multibyte sequence Python中打开一个文件夹编写，file1 = open(‘E:\数据挖掘报告.txt’, ‘a’) 在写入的过程中出现了报错： UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u2022’ in position 7: illegal multibyte sequence 解决方案：在打开文件时添加encodin

在Python中使用print输出时，出现UnicodeEncodeError错误，错误提示为“‘gbk‘ codec can‘t encode character ‘\u2022‘ in posit

zengyunda的博客

03-28

8895

python 输出打印时报错： print(data_results) UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 82: illegal multibyte sequence

Python3中出现'gbk' codec can't encode characte的成功解决方法？

因为，一个人

07-08

1万+

亲身测试，所遇问题完全解决！ 2018/07/08 21:37 环境：windows，Pycharm，python3.6.2使用Python写文件的时候，或者将网络数据流写入到本地文件的时候，大部分情况下会遇到：UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。网络上有很多类似的文...

python encoding报错_Python：'gbk' codec can't encode character

weixin_39736650的博客

12-15

635

Python异常UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd'

曾记否？的博客

09-10

4万+

问题描述在写爬虫爬取网页信息时，发生了以下错误： UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' 意思大致是Unicode编码错误，gbk编解码器不能编码\ufffd字符。爬虫程序爬取的是课程信息，包含中文。使用requests库访问网页，使用BeautifulSoup库解析网页，用get_text()方法...

python gbk codec_python ‘gbk’ codec can’t encode错误

weixin_42531886的博客

12-23

1555

不同编码集能表示的符号是不同的，而且这些符号解码后对应的值也不同。在将一个二进制数据编码成文本时，如果有一个符号无法编码，很有可能是因为选择的编码方式不正确。对于这种情况下，比起不声不响地跳过这部分内容，python的默认方式是选择了使用异常进行提示。个人觉得，这种方式可以避免一些逻辑错误，因此是一种比较明智的方式。对于这一问题的处理：选择正确的编码方式当然是正确的解决方案。按题主的意思，就是要用...

python 报错'gbk' codec can't encode character '\ue5d1' in position 0:

IT届的小学生

06-17

3445

在网络怕爬虫过程中遇到，编码错误 'gbk' codec can't encode character '\ue5d1' in position 0: illegal multibyte sequence response = requests.get(url) html_uid = response.text # name=html_uid["result"]['name'] # pat

python中关于'gbk' codec can't encode character u'\xxx'的问题

weixin_34400525的博客

09-12

821

为什么80%的码农都做不了架构师？>>> ...

UnicodeEncodeError: gbk codec can t encode character \ue253 in position 636: illegal multibyte sequence

07-27

- *1* [已解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘ŗ‘ in position 1: illegal ...](https://blog.csdn.net/yuan2019035055/article/details/126582320)[target="_blank" data-report-...