关于 IDLE 上发生 UnicodeDecodeError 问题的解决办法

最新推荐文章于 2022-09-15 23:47:38 发布

罗梦溪

最新推荐文章于 2022-09-15 23:47:38 发布

阅读量549

点赞数

分类专栏： python初学者文章标签： UnicodeDecodeError python utf-8 ascii

本文链接：https://blog.csdn.net/roger20124/article/details/62539897

版权

python初学者专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近在学习python，练习一个汉字分词的算法的时候，发现程序总是会出现形如

UnicodeDecodeError: 'utf8' codec can't decode byte 0x?? in position ?

的错误警告。

找了一些资料最终解决了问题，所以记录一下。

使用的python为2.7版本，平台为IDLE。

在程序里执行

import sys
print sys.getdefaultencoding()

得到输出为

ascii

说明系统默认的字符编码方式是ascii码方式，为了对读取文本和键入的汉字进行，在程序中采用了

sentence = unicode(sentence,'utf-8')

其中sentence是键入或是读取文件中的一行数据。

然后解释过程中就会发生形如

UnicodeDecodeError: 'utf8' codec can't decode byte 0x?? in position ?

的错误警告，并且明确指示为

sentence = unicode(sentence,'utf-8')

存在错误。

问题在于，IDLE由于采用ascii作为默认编码，对于键入的汉字则默认采用了gbk的编码方式，因而unicode使用解码utf-8编码方式就会发生错误。

正确的做法是，使用

sentence = sentence.decode('gbk')

或是

sentence = unicode(sentence,'gbk')

将gbk编码的汉字字符转换为unicode编码。

类似的问题应该都是由于混合编码导致的，注意统一编码应该就都能解决问题。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

罗梦溪

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

关于python_IDLE右键无法使用_解决方法

12-22

2.在桌面新建一个 IDLE.py>右键属性>常规>打开方式更改>点击更多应用:down_arrow:>在这台电脑上查找其他应用>选择路径C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Lib\idlelib\ 点选idle.bat>...

python utf-8报错_python处理一些乱码的中文文本时decode('utf-8')报错的处理

weixin_39618339的博客

12-04

1457

用python写脚本时，遇到处理中文(乱码的中文)时，用decode('utf-8')会发现始终会报错>>> txt_from = open('/home/love/ex130705.log')>>> txt_from_iter= iter(txt_from)>>> txt_proc = txt_from_iter.next().decode(...

参与评论您还未登录，请先登录后发表或查看评论

UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 2: illegal mu

qq_36346625的博客

09-17

1万+

今天看慕课《Python语言程序设计》（北京理工大学嵩天）的时候，PPT里有段代码，照着敲在自己电脑上运行时，出了问题。源代码如下： #txt_poen.py 文本形式打开一个文件 #f.txt 和 txt_poen.py 共同保存在同一个文件夹中 #tf = open(“f.txt”, “rt”); tf = open(“f.txt”, “rt”) print(tf.readline())...

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 0: invalid start byte

LuoMin2523的博客

07-20

1万+

知识点 str与bytes,encode() 与 decode() Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。Python对bytes类型的数据用带b前缀的单引号或双引号表示： x = b'ABC' 要把bytes变为str，就需要用decode()方法： >>> b'ABC'.decode('ascii') 'ABC' >>>

python IDLE 控制台输出乱码问题

ShewMi的专栏

02-08

3727

近日使用了python交互终端写程序，发现一个奇怪的现象。使用windows记事本编写py输出简单的一句话：

在cmd里不报错，在IDLE里却报错的解决方案

渡梦酒的博客

09-15

958

如果两者不一致，则证明有多个python，只需要留cmd里的那个版本就够了，把多余的卸掉就不会报错了。如果cmd里没报错，但在idle里就报错，那么就是你的电脑里有多个python。：在cmd里输入python查看（如图，3.8.8就是python的版本号）cmd里的python版本号。

解决Python2.7中IDLE启动没有反应的问题

09-19

- **重装Python**：如果上述方法都无法解决问题，建议卸载并重新安装Python2.7。这一步骤可以在最大程度上解决由安装过程中的错误引起的启动问题。 #### 结语通过本文介绍的方法，相信大多数用户都能够成功解决...

Python文件右键找不到IDLE打开项解决办法

09-21

#### 一、解决问题前的准备工作在尝试解决这个问题之前，首先确保已经正确安装了Python环境，并且安装路径没有包含空格或特殊字符。这是因为路径中的特殊字符可能会导致注册表设置出现错误。 #### 二、双击.py...

解决『.py』文件的右键菜单『Edit with IDLE』无效或缺失问题

06-26

本文件（***.reg）通过安装注册表的方式，直接解决『.py』文件的右键菜单『Edit with ...或者您可以参考作者在CSDN上的文章（解决『.py』文件的右键菜单『Edit with IDLE』无效或缺失问题），可直接搜索后按步骤设置。

一条命令解决mac版本python IDLE不能输入中文问题

09-20

unicode error三种解决方案

zico_a的博客

11-14

3万+

问题描述：在定义图片路径的时候，系统提示unicode error编解码器无法解码位置，截断\ uXXXX转义，如下图：原因分析：window 读取文件可以用\，但是在字符串中\是被当作转义字符来使用，经过转义之后可能就找不到路径的资源了，例如\t会转义为tab键解决方法： 1.更换为绝对路径的写法 func1("C:\\Users\\renyc") 2.显式声明字符串不用转义（加r） f...

IDEA 统一设置编码为utf-8编码

mao_xiaoxi的博客

04-06

757

问题一： File->Settings->Editor->File Encodings 问题二： File->Other Settings->Default Settings ->Editor->File Encodings 问题三：将项目中的.idea文件夹中的encodings.xml文件中的编码格式改为uft-8 问题四： File->Settings->Build,Execution,Deployment ->.

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte xx in position xx: invalid continuation byte

热门推荐

weixin_43718742的博客

12-17

5万+

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position xx: invalid continuation byte ；Unicode解码错误: 'utf-8'编解码器无法解码位置（第38行）中的字节:因为这个字节是无效的延续字节；pandas库的to_csv；'str' object has no attribute 'decode'

【Python 问题解决】---- UnicodeDecodeError: ‘utf-8‘ codec can‘t decode

止于至善

06-08

2782

2. 报错图片 WXRUI体验二维码我的博客，欢迎交流！我的CSDN博客，欢迎交流！微信小程序专栏前端笔记专栏微信小程序实现部分高德地图功能的DEMO下载微信小程序实现MUI的部分效果的DEMO下载微信小程序实现MUI的GIT项目地址微信小程序实例列表前端笔记列表游戏列表...

JAVA与IDEA编码（乱码问题分析）全解析

GoldenBullet的博客

04-08

2884

对于整个编码问题的根本分析思路可以先参考我的另一篇博客：网页设计中文乱码原理剖析本文从四个方面解析JAVA与IDEA的编码问题 1. 代码源文件的编码与javac编译器使用的编码 2. java程序输出编码与显示控制台使用的编码 3.properties文件的编码问题 IDEA关于编码的设置主战场 ...

python 编码总结

CH3TK的博客

10-26

569

1、#coding:utf-8 2、import sys import sys reload(sys) sys.setdefaultencoding('utf-8') 3、解码为unicode 60 def strdecode(sentence): 61 if not isinstance(sentence,

对jieba分词的分词模型进行抽取，简单实现

z2539329562的博客

03-29

1449

因为水平一般，所以将jieba库中分词模块的代码进行简化，这里全部使用函数实现 import jieba from jieba.finalseg.prob_emit import P as emit_p from jieba.finalseg.prob_start import P as start_p from jieba.finalseg.prob_trans import P as t...

arcgis python 二次开发工具箱中文乱码编码转换测试总结

m0_62073075的博客

06-17

2354

在idle中，会按utf-8（编码声明）对‘中文’这个字符串进行编码。就是'\xe4\xb8\xad\xe6\x96\x87'。而在arcgis调用时，会先按utf-8（编码声明）对‘中文’这个字符串进行编码。就是'\xe4\xb8\xad\xe6\x96\x87'。然后在按encode('utf-8')进行编码（这是arcgis独有的）。但对非Unicode字符串进行编码时，会先解码成Unicode，然后再进行编码，通常情况下会默认按系统编码进行解码，但arcgis并不参考系统编码，一律按gbk强行解

python 字符编码出现的问题 IDLE 一定要设置啊！！！！！！！

Alvin__Yang的博客

04-18

4495

python 字符编码出现的问题 IDLE 一定要设置啊！！！！！！！ python 字符编码出现的问题 IDLE 一定要设置啊！！！！！！！ python 字符编码出现的问题 IDLE 一定要设置啊！！！！！！！ python 字符编码出现的问题 IDLE 一定要设置啊！！！！！！！

解决Windows7安装Python后IDLE无法打开的问题

如果尝试上述步骤仍然无法解决问题，可以尝试通过命令行启动IDLE。打开命令提示符，导航到Python安装目录（例如，`C:\Python31`），然后输入命令`python lib\idlelib\idle.py`来直接运行IDLE。这样做可以帮助识别...