python读取中编码错误（illegal multibyte sequence ）

最新推荐文章于 2025-02-19 09:55:39 发布

阿黄Ahuang

最新推荐文章于 2025-02-19 09:55:39 发布

阅读量9.7w

点赞数 44

读取中文txt文件时，经常会出现: ‘gbk’ codec can’t decode bytes in position 31023: illegal multibyte sequence。
主要讲一种情况就是文章中含有utf-8或gbk无法编码的字符情况。
好多人都说加入’ignore’，但一直都没有说清楚是在open函数中加入，还是在.read()中加入（其实是在open函数中加入，如下面例子）。
‘gb1830’所含的比’gbk’要多，因此下面代码段采用了’gb1830’。

 cf=open("D:\A仲敏2015\python_code\天龙八部.txt",encoding='gb18030',errors='ignore')cf1=cf.read()

本文来自小木头1209 的CSDN 博客，全文地址请点击：https://blog.csdn.net/jiasudu1234/article/details/71173281?utm_source=copy

python中打开文件，open(‘d:/data/synopses_list_wiki.txt’)
出现如下错误：
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x93 in position 20651: illegal multibyte sequence
报错：

原因是含有无法编码的字符，或者是打开的编码不对。
解决方法一：用 utf-8 编码打开（实际文件的编码方式）
如下： open('d:/data/synopses_list_wiki.txt',encoding='utf-8')

解决方法二：在open中加入errors=‘ignore’ ，忽略它即可
如下：

open('d:/data/synopses_list_wiki.txt',errors='ignore')

本文来自狗狗25 的CSDN 博客，全文地址请点击：https://blog.csdn.net/wzying25/article/details/79030848?utm_source=copy

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿黄Ahuang

关注关注

44
点赞
踩
90

收藏

觉得还不错? 一键收藏
13
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xbd in position 14: illegal multibyte sequence

追光者♂：记录、分享、总结、提升，现象级专栏《Python从入门到人工智能》作者，无惧黑暗，坚信曙光

09-01

641

问题记录，encoding = 'utf-8'

UnicodeDecodeError ‘gbk‘ codec can‘t decode byte 0xaf in position 850:illegal multibyte sequence解决方案

weixin_43178406的博客

06-14

18万+

本文主要介绍了UnicodeDecodeError ‘gbk’ codec can’t decode byte 0xaf in position 850:illegal multibyte sequence解决方案，希望能对使用Python的同学们有所帮助。文章目录 1. 问题描述 2. 解决方案

13 条评论您还未登录，请先登录后发表或查看评论

‘gbk‘ codec can‘t decode byte 0x91 in position 8: illegal multibyte sequence问题与解决

qq_41434735的博客

09-21

1773

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xae in position 209: illegal multibyte sequence

热门推荐

云水禅心的博客

08-01

56万+

今天，练习一个通过读取txt文本信息（英文版的Walden.txt），统计文本中的英文单词词频。在读取Walden.txt文本时，出现了“UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”错误提示。错误的意思是：Unicode的解码（Dec

illegal multibyte sequence

zangbianer的博客

11-26

3万+

抓取数据时遇到的问题 gbk无法解码，illegal multibyte sequence 原因：1.utf-8编码 2.gbk编码，但是有多字符和特殊字符gbk无法解码解决方式：打开网页：F12 在console输入document.charset 查看编码方式确定编码方式后，如果是utf-8 就改编码语言，如果是gbk那么问题就出在第二项上解决方式：改用复杂度更高的gb18030，解码...

‘UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 2: illegal multibyte sequence’

A_beard的博客

05-06

5705

import matplotlib.pyplot as plt with open(r'E:\pythoncoda\read\notebook.txt') as file: 对txt文件进行读取，出现错误提示 ‘UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence’ 解决方法:在读取文件代码处加上；encoding='utf-8' 再次运行就不会报错。 .

python读取中文文件时，UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 20: illegal multibyte sequence

07-06

当你尝试使用Python读取一个编码为GBK的中文文件时，可能会遇到`UnicodeDecodeError`，比如提示'gbk' codec can't decode byte 0xad in position 20: illegal multibyte sequence。这是因为Python默认编码通常是UTF-...

python读取csv报错UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence

10-08

当你在Python中尝试读取CSV文件时遇到`UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence`这样的错误，通常意味着你正在尝试用GBK编码来解析一个非GBK编码的文件...

Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytein position 2: illegal multibyte sequence

innetdancer的博客

05-30

9068

错误的意思是：Unicode的解码（Decode）出现错误了，以gbk编码的方式去解码（该字符串变成Unicode），但是此处通过gbk的方式，却无法解码（can’t decode）.''illegal multibyte sequence"的意思是非法的多字节序列，也就是说无法解码了。比如有中文的存在，老老实实用 utf-8。文本中出现的一些特殊符号超出了gbk的编码范围，可以选择编码范围更广的‘gb18030’出现这样的错误，可能是要处理的字符串本身不是gbk编码，却是以gbk编码去解码。

python3 读取文件时，报编码错误（illegal multibyte sequence ）

hhd1988的专栏

11-11

5625

问题现象：有时当读取一个文件时，报出以下错误，很是捉急。 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 7205: invalid continuation byte 问题原因: 文件中含有utf-8或gbk无法编码的字符，或者是打开的编码不对。解决方法：解决方法一：用 utf-8 编码打开（实际文件的编码方式）如下：open('d:/data/synopses_list_wiki.tx..

Python-illegal multibyte sequence

MyFreeIT

06-27

1078

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa2 in position 1233: illegal multibyte sequence 非法的多字节序列 encoding='utf-8'

python读取中编码错误（illegal multibyte sequence 、invalid start byte等错误）

mrx9520的博客

06-19

1323

t=open('D:\我的文档\下载\XXX.docx','r',encoding='GBK',errors='ignore')#errors='ignore'好多人都说加入’ignore’，但一直都没有说清楚是在open函数中加入，还是在.read()中加入（其实是在open函数中加入，如下面例子）。主要讲一种情况就是文章中含有utf-8或gbk无法编码的字符情况。

illegal multibyte sequence问题

Time_traveler233的博客

06-29

630

解决UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa6 in position 9737: with open(file) as f：将其改成： with open(file,encoding=“utf-8”) as f：

python解密工具Ciphey运行出现UnicodeDecodeError:illegal multibyte sequence报错问题

AFCC_的博客（Web_Dog）

03-27

6467

Ciphey使用illegal multibyte sequence报错问题问题描述__init.py文件regex_identifier.py文件python版本问题问题描述 CTF中很多编码加密问题都可以使用ciphey工具深度学习自动化求解，会把可能的加密方式分析出来并给出结果。今天使用pip install ciphey安装 ciphey模块后在使用时出现了报错。 UnicodeDecodeError: 'gbk' codec can't decode byte 0xbf in position

python转码问题： in position 30664-30665: illegal multibyte sequence

南京大学的CS渣

12-08

664

在Python中，可以对String调用decode和encode方法来实现转码。比如，若要将某个String对象s从gbk内码转换为UTF-8，可以如下操作 s.decode('gbk').encode('utf-8′) 可是，在实际开发中，我发现，这种办法经常会出现异常： UnicodeDecodeError: ‘gbk' codec can't decode byte