python的编码问题

最新推荐文章于 2023-02-16 18:54:56 发布

linyilong3

最新推荐文章于 2023-02-16 18:54:56 发布

阅读量128

点赞数

本文链接：https://blog.csdn.net/linyilong3/article/details/100881275

版权

最近在用python写一些辅助脚本，发现每次运行的时候都会出现无法解析的字符编码的问题

后来发现是因为在代码的头里面加了这么一行

#coding=utf-8

加了这么一行就会出现这个错误

SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0:

invalid start byte

这个错误的大概意思就是python在寻找UTF-8标致头的时候出现了错误

出现这个错误的原因是我们在文件头给python指定了编码为UTF-8，但是我们文件确是以GBK的方式存储的

所以只要把utf-8改成gbk就可以了，这样python就会认为这是一个gbk的编码文件，而不会想去查找UTF-8的头

题外话:

为了识别文件究竟是UTF-8还是ASCII，一般UTF-8都会在文件头部加入EF BB这个头，而GBK是没有头的，所以python发现没有这个头则会认为是错误的

之前在用QT的时候也遇到了这些问题

http://www.cnblogs.com/linyilong3/p/4868697.html

其实中文编码的问题已经存在很多年了，只是一直没人去解决，最近我开始碰到后，才开始着手解决这个问题，争取有空把原来的中文问题都解决掉

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

linyilong3

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

学习python处理python编码问题

12-24

二、python源文件的编码与解码，我们写的python程序从产生到执行的过程如下：编辑器—->源代码—->解释器—->输出结果 2.1、编辑器决定源代码的编码格式（在编辑器中设定） 2.2、也必须要解释器知道源代码的编码...

python3：(unicode error) 'utf-8' codec can't decode

热门推荐

呆瓜呆呆的专栏

03-16

11万+

环境：操作系统：win7 旗舰版语言：python3.4 文本编辑器：vim、notepad++ 报错：SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0:invalid start byte 说明：我一开是是使用vim编辑器写python程序。当在使用三引号'''中文字符串，

参与评论您还未登录，请先登录后发表或查看评论

'utf-8' codec can't decode byte 0xb4 in position 4: invalid start byte

weixin_42592399的博客

02-16

4030

这是一个编码错误，通常是因为你正在尝试用UTF-8编码解码一个不是UTF-8编码的文本。在这个错误消息中，它告诉你在第4个位置发现了一个0xb4字节，但它不是UTF-8编码的起始字节，所以解码失败了。如果你知道这个文本的正确编码方式，你可以使用正确的编码方式进行解码。 ...

python报错：SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 2:invalid sta

yaj13346943285的博客

05-12

9081

编辑环境说明：我是使用Notepad++编辑的代码现象说明：当在.py中使用三引号'''添加注释时，运行就报错。原因说明：用Notepad++可以看出.py文件存储的格式是ANSI 问题解决：将保存文件的格式换成UTF-8即可：编码>> 转为UTF-8格式参考资料：http://blog.csdn.net/ch7543658/a

python 编码问题 UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb4 in position 0: invalid start byt

rifengxxc的博客

08-02

1万+

解决python下的一种编码问题

python查询mysql中文乱码问题

09-10

Python查询MySQL时遇到的中文乱码问题是一个常见的编程困扰，特别是在使用Python 2.7版本时更为突出。本文将深入探讨这个问题的成因，并提供一套详细的解决方案。首先，我们需要了解问题的根本原因。当Python与...

python编码问题的测试代码

07-30

遵循最佳实践，如始终指定编码，保持编码一致性，以及正确处理Unicode和非Unicode字符串，可以帮助我们避免常见的乱码问题。通过分析`python_coding.py`和`hongloumeng.txt`，我们可以进一步加深对这些概念的理解。

python3编码问题汇总

09-21

#### 四、Python编码基础为了更好地理解上述问题，我们需要深入了解Python中的编码原理。 ##### 4.1 字节与字符在计算机中，一个字节(Byte)由8个比特(Bit)组成，可以表示从`00000000`到`11111111`共256种状态。...

python读取文本文件时报错‘utf-8‘ codec can‘t decode byte 0xb4 in position 100:

zzzzxqa的博客

07-26

950

在读取文件时用二进制读取，之后再baqi转换为你需要的格式， fi = open(“icourses.txt”,“rb”) ls=[] for line in fi: line=line.decode(‘gbk’,“ignore”) #出现异常报错是由于设置了decode()方法的第二个参数errors为严格（strict）形式造成的，因为默认就是这个参数，将其更改为ignore等即可。文本文件中有中文用UTF8会乱码，使用了gbk正常展示详见：https://blog.csdn.net/wang7807

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb4...

Scarlett的博客

06-01

1万+

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb4 in position 10: invalid start byte 原因：中文字符的Unicode编码0x0800-0xFFFF之间,(utf-8包含了部分汉字) 当你试图将该“中文字符”转成U码的utf-8时超出了其范筹.而GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号，并有所补充解决方法：将.decode(‘utf-8’)改为.decode(‘gbk’) #f

python报错"utf-8 codec can't decode byte 0x"

jonathanzh的博客

11-24

6万+

望文生义，报错的内容就是说utf-8的编码方式不能解码0x的字节，选择正确的解码方式就可以解决。深入些理解，可以把编码就是编成字节数据，就是二进制的东西，解码以后就是我们看懂的字符串，python里面就是unicode类型。但是打码的方式有很多，需要采用适合的方法（打码方法）才能下马。比如在文件操作时，encode就是指明文件读写时的编码方式。具体到python中，utf-8编码的文本...

'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte

J_VAR13的博客

09-23

1万+

在导入一个类是出现了这样的提示，主要原因是编码格式不正确。点击文档中的编码格式，选择utf-8的编码，即可正常运行。

Python报错"utf-8' codec can't decode byte 0xb0 in position 0: invalid start byte"

weixin_45901516的博客

05-11

8738

Python报错"utf-8’ codec can’t decode byte 0xb0 in position 0: invalid start byte" 上周在做变量相关性分析时，导入数据一直提示报错，用的Spyder，从来没遇到过这个情况，代码如下：报错提示如下：后面发现仅仅是数据源文件上传格式不对，修改为GBK即可修改后代码如下： ...

Python 错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte

Teaphon

08-12

2万+

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 0: invalid start byte 的意思是： Unicode解码错误：'utf-8'编解码器无法解码位置0的字节0xbe：无效的启动方式简单讲就是咱的txt文件存储的时候选的文件编码方式它解不了，就比如说你会说法语、韩语、日语，英语、汉语，但...

python编码问题 utf-8 codec can not decode byte

a563562675的博客

05-28

5308

问题描述在用python读txt文件的时候遇到了编码问题：‘utf-8’ codec can’t decode byte 0xb70，同样的代码之前在python2的时候是不会出现问题的。用百度找了一下也没能找到有效的解决方法，后来在stackoverflow上找到了类似的问题。 stackoverflow问题解决方案 str = unicode(str, errors='replace') or str = unicode(str, errors='ignore') 这个操作会删除（忽略）有问题的

解决(unicode error) 'utf-8' codec can't decode byte 0xbb in position 0: invalid start byte

异想天开

04-16

6万+

在python文件中加了中文字符，执行就报错： SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xbb in position 0: invalid start byte 我们一般会在python文件第二行添加如下编码申明： # -*- coding:utf-8 -*- 这个地方重点要注意就是，申明只是告诉python...

Anaconda UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb4 in position 0: invalid start byte

weixin_53366150的博客

07-18

4297

Anaconda Navigator 启动卡在 Loading Application，报错：utf8 code can't decode...

python乱码问题