python2 python3编码_python2升级到python3时遇到的编码问题汇总

最新推荐文章于 2022-08-22 20:56:53 发布

weixin_39732491

最新推荐文章于 2022-08-22 20:56:53 发布

阅读量94

点赞数

文章标签： python2 python3编码

本文档总结了python2->3升级过程中遇到的编码问题

1.UnicodeDecodeError：“ascii” codec cannot decode byte oxe6 in position 501：ordinal not in range

定位：从报错日志可以发现代码运行到with open(a.txt, "r")as f:时报错，即读取文件时出错。

分析：with open 方法参数encoding没有写则默认为ascii，查看磁盘上的文件编码格式为utf8。故导致指定的ascii不能打开utf8编码的文件，ascii不能完全匹配utf8的字符集。

解决：with open(a.txt, "r")as f:改为with open(a.txt, "r", encoding="uft8")as f:

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

2.UnicodeDecodeError：“utf8” codec cannot decode byte oxa3 in position 25：invalid start byte

定位：报错日志指向with open(b.txt, "r", encoding="uft8")as f:

分析：磁盘上b.txt是utf8的编码格式，encodeing也指定了，但oxa3（utf8编码）是一个无效的字节，在文本模式（“r”）读取时无法解码为unicode编码格式。

解决：

方法1.删除b.txt里面的中文。

方法2.r->rb，以二进制形式读取，byte->byte，不会出现byte->str的解码报错信息。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39732491

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python2转python3后出现的UnicodeDecodeError、KeyError解答记录

yuemo3353009的博客

10-13

537

文章目录项目之前是python2, 改成python3后，注意以下几点：`1. pickle模块``2. 文件加载`2.1 原始代码及错误2.2 第一次修改（无效）2.3 第二次修改（这个语句不报错了，但出现了另一个错误KeyError）：2.4 KeyError的根源：bytes与str类型2.5 最后一次修改（成功）`小结` 项目之前是python2, 改成python3后，注意以下几点： (关键错误类型：UnicodeDecodeError编码错误、KeyError键错误) 1. pickle模块

python2的代码在Python3环境中报错：UnicodeDecodeError: 'ascii' codec can't decode byte 0x8b in position 6:

黑手黛博拉的博客

08-20

419

python 2代码data = pickle.load(f)放到python 3 中会报错 UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0x8b in position 6: ordinal not in range(128) 再打开的时候指定编码方式即可 data = pickle.load(f,encoding='iso-8859-...

参与评论您还未登录，请先登录后发表或查看评论

python3报错：UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in ran

真的是个瘦子

06-22

4485

貌似0xe6的错误和其他的错误是不一样的但是anyway都是编码出错了 hypotheses_1 = [line.strip().split() for idx, line in enumerate(open(model_1_rewrite_test_file, 'r').readlines())] 加入encoding时错误消失 hypotheses_1 = [line.str...

python2和python3的编码问题

nibuyaoshiwang的博客

12-25

325

首先说一点，python3将utf-8作为默认编码，也就是我们再也不用像2一样，在文件的开头先写一行: # encoding:utf-8 这个习惯已经改不掉了，就像每个文件夹下写创建init文件一样。言归正常，我只说python3。转化 str -> bytes : a.encode(“utf-8”) bytes -> str : a.decode(“utf-8”) pyhon3的bytes 在python3里面，bytes是二进制，但也是各种编码格式被编后的类型。比如utf-8，gbk格

解决Python UnicodeDecodeError: ‘ascii’ codec can’t decode

Just Do It

04-13

368

注：本文转自http://blog.csdn.net/mindmb/article/details/7898528 今天做网页到了测试和数据库交互的地方，其中HTML和数据库都是设置成utf-8格式编码，插入到数据库中是正确的，但是当读取出来的时候就会出错，原因就是python的str默认是ascii编码，和unicode编码冲突，就会报这个标题错误。那么该怎样解决呢？通过搜集网上的...

Python 2与Python 3版本和编码的对比

09-21

然而，Python 2的广泛使用意味着开发者在迁移到Python 3时需要解决兼容性问题。尽管Python 2在某些场景下仍有其价值，但Python 3的标准化和编码处理的改进使其成为未来的发展方向。理解这些差异对于编写跨版本兼容的...

python2 与 python3 编码问题总结

zjm750617105的专栏

09-16

285

之前遇到过好多各种各样的问题, 特别是在python2下, 先在准备总结, 遇到一个总结一个: unicode 字符在python2下采用 ,在python3下统一为 string 类型. 那么如何在python2下将一句话中的所有unicode字符转化为str类型呢? 下面几种都试试, 不行就直接换python3吧. # 数字 true = u'1' print(type(true...

Python2和3字符编码的区别知识点整理

12-31

python2用的是ascii, python3默认是utf8读取字符 # coding:gbk会告诉python3解释器用gbk编码读取字符 python3(了解) 你看到的其实是unicode 但是终端帮你把这个unicode的0和1做一个转换,从unicode转换成了终端能够...

python中的编码问题（python2和python3）

小蚂蚁cc的博客

07-01

149

涉及的编码我们知道，计算机内部，所有信息最终都是一个二进制值。而编码就是我们日常索所能看到和理解的字符与二进制值之间的映射关系。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为 ASCII 码，一直沿用至今。但是，随着计算机的普及，其他国家也需要制定一套支持本国语言的映射关系，这边有了许许多多的编码规范。 ASCII：八位二进制组合出256种状态...

解决python 读取 log日志的编码问题

09-18

在Python编程中，处理日志文件是常见的任务之一，尤其是当日志文件是以特定编码（如GBK）存储时，可能会遇到编码问题。本篇文章将详细探讨如何解决Python在读取GBK编码的日志文件时遇到的问题。首先，让我们理解...

Python之——UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 0 解决办法

热门推荐

冰河的专栏

01-05

1万+

转载请注明出处：http://blog.csdn.net/l1028386804/article/details/78976807 最近在用Python处理一些中文数据时，报出了如下错误： UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 0: ordinal not in range(128)

python2和python3编码问题

程序员学编程的专栏

08-19

2021

欢迎加入python学习交流群 667279387 一、什么是编解码 1、什么是unicode 2、编码方式二、python中的编解码 1、python2 （1）.encode() 和 .decode() （2）编解码错误和处理（3）令人抓狂的隐式转换 2、python3 （1）encode和decode （2）无隐式转换（3）编程注意点参考资料：近期有同学...

Python2.x /3.x UnicodeDecodeError 解决办法

小白的博客

10-23

631

报错： UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 2644: ordinal not in range(128) 对于Python2.x ： import sys reload(sys) sys.setdefaultencoding("utf-8") 对于Python > 3.4 ： ...

Python3中，错误信息：UnicodeDecodeError正解

hito_Chen的博客

04-16

292

这个报错一般是由于python2和python3.x编码的问题。追溯到错误code: train, val, test = pickle.load(f) 似乎看不出有什么问题，一般git clone下来的代码需要注意python版本，还是存在着差异的。解决方案：增加编码格式： train, val, test = pickle.load(f,encoding='bytes') 此外，在安...

[Python] 中文编码问题：raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题

ainivip的专栏

03-10

1022

最近研究搜索引擎、知识图谱和Python爬虫比较多，中文乱码问题再次浮现于眼前。虽然市面上讲述中文编码问题的文章数不胜数，同时以前我也讲述过PHP处理数据库服务器中文乱码问题，但是此处还是准备简单做下笔记。方便以后查阅和大家学习。中文编码问题的处理核心都是——保证所有的编码方式一致即可，包括编译器、数据库、浏览器编码方式等，而Python通常的处理流程是将unicode作为中间转...

python2和python3中的编码问题

longshuo1995的博客

08-05

314

a = ‘中文’ 在python2中是utf-8格式的编码在python3中是unicode格式的编码a = '中文' a '\xe4\xb8\xad\xe6\x96\x87' b = a.decode('utf-8') b u'\u4e2d\u6587'综上所述，在python2中，中文是使用指定的utf-8进行编码的，可以对其解码成unicode的格式（代码中的变量b）而在Python3中

Python3的unicode编码转换成中文的问题及解决方案

09-18

在处理Python3的unicode编码转换为中文时，我们经常遇到的问题是，当我们尝试将包含unicode字符的字符串打印或者写入文件时，Python解释器有时并不会如我们所预期地将其转换为中文显示。这种现象尤其在从网络爬虫...

Python编码问题的解决方案总结

qq_1443539042的博客

08-05

3062

初学 Python，相信大家遇到的一大难题就是编码问题，如下： >>> Traceback (most recent call last): File "/Users/FishC/Documents/Python/test.py", line 2, in print(f1.read()) File "/Library/Framewo

python not in range_【已解决】Python字符串处理出现错误：UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe6 in...

weixin_39630735的博客

12-08

1083

【问题】在写Python过程中，需要实现对应的字符串替换，将gVal[‘newPostPatStr’]的值：本博客已搬家至：在路上 – On the way：技术当前帖子的新地址是：${titleName}如果帖子地址有变化而导致无法访问新帖子，请在网站右上角的搜索框中搜索帖子标题，即可找到最新帖子。—————————————${originBlogContent}中的${titleName}替换...

Python编码问题

rs勿忘初心的博客

08-22

1483

临时解决：把Python3中的ascii.py的内容用utf_8.py文件内容替换。知道是编码的问题，但是不知道具体什么原因，最后是按照下面这个方法解决的。