python3 utf8编码无法解码的两种处理方式

星海编程日记

已于 2023-01-11 11:53:47 修改

阅读量5.4k

点赞数

分类专栏： python 文章标签： python

于 2020-10-14 11:50:36 首次发布

本文链接：https://blog.csdn.net/xinghai_2009/article/details/109069315

版权

python 专栏收录该内容

1 篇文章

订阅专栏

本文探讨了在Python中遇到的UnicodeDecodeError，分析了问题原因：ASCII编码无法处理中文字符。针对print()函数和open()函数读取文件时的编码问题，提供了两种解决方案：一是使用codecs模块改变stdout编码，二是通过指定'utf-8'编码打开文件。了解这些技巧对于正确处理中文字符至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

代码一

print("中文")

报错描述

UnicodeDecodeError: 'utf8' codec can't decode byte 0xcc in position 468: invalid continuation byte

问题分析

print() 函数调用了 system.out.write()
system.out 对象的默认编码方式为 ASCII
ASCII 编码方式不支持中文

解决方案

import codecs
sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
print("中文")

代码二

open(filename, 'r')

报错描述

UnicodeDecodeError: 'utf8' codec can't decode byte 0xcc in position 468: invalid continuation byte

问题分析

当我们打开文件时，open()函数以默认的编码方式打开文件

解决方案

open(filename, 'r', encoding='utf-8')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

星海编程日记

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Python编程错误：‘utf-8‘编解码器无法解码字节0xd5】--解决方法详解

03-26

8571

在Python编程过程中，遇到’utf-8’编解码器无法解码字节0xd5错误是很常见的。如果您遇到这个问题，可以尝试使用上述方法来解决它。无论您选择哪种方法，都需要仔细检查和理解代码，以确保它能够正确地解码文件中的内容。

python3中文文件转换为utf-8编码

qq_36573282的博客

04-28

1万+

在使用python3 转换文件编码的时候，读到一个文件的时候，显示在read() 处出现UnicodeDecodeError。但是用notepad++打开显示的文件编码就是gb2312。后来看到这篇博客https://www.jianshu.com/p/9cb55b7173ae，gb18030可以编码更多的字符，因此试着用gb18030读取文本，没有出现错误。代码如下： def chang...

参与评论您还未登录，请先登录后发表或查看评论

【Python】解释器读取文件编码问题以及文本输出问题，提示报错utf-8 codec can‘t decode

小5聊的博客

03-18

6281

基于上篇文章内容，在使用python代码时，如果是初学者，很容易出现编码问题报错，以及输出文本的报错。 Python编辑器默认读取的是Unicode编码，对于Python而言，print输出方法，所有内容都应该是字符串，否则报错。

如何用Python创建UTF-8编码的文本文件：从入门到精通

最新发布

cda2024的博客

04-18

1007

在当今数字化时代，数据无处不在。处理不同语言和字符集时，编码问题常常成为程序员头疼的难题。你是否曾经遇到过打开一个文本文件却看到乱码的情况？这很可能是由于编码不匹配导致的。那么，怎么用Python创建一个编码格式为UTF-8的文本文件呢？掌握这一技能，就如同拿到了一把解锁多语言数据处理大门的钥匙，让你在编程世界中更加游刃有余。

Python 报错 unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c

日常学习与专研的记录

03-21

3478

Python 解决读取文件报错 “unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c”

python报错utf—8_python>报错unicodeDecodeError:' utf-8'...怎么解决?

weixin_39997400的博客

11-20

337

本帖最后由 zhcj66 于 2019-3-26 16:34 编辑C:\ Users\ Administrator\ Desktop\ PyQt5>pipenv --three Traceback (most recent call last): File"c:\ python\ python37-32\ lib\ runpy. py", line 193, in _run_module_as_m...

QT无法使用“UTF-8”编码解码

mianbaodeshou的博客

03-05

982

QT无法使用“UTF-8”编码解码

python3的url编码和解码,自定义gbk、utf-8的例子

09-18

本篇文章将深入探讨如何使用Python 3进行URL编码和解码，并给出自定义编码格式（如GBK和UTF-8）的实例。首先，URL编码是一种标准，用于将特殊字符转换为可以在URL中安全传输的形式。在URL编码中，非字母数字字符会...

Python字符编码转码之GBK,UTF8互转

09-18

本文将详细讨论Python中GBK和UTF-8两种编码格式之间的转换，并解释它们各自的特点。首先，了解Python中的字符编码至关重要。在Python 2中，默认的字符串编码是ASCII，它只能表示128个基本的西文字符，无法容纳中文...

python解决js文件utf-8编码乱码问题(推荐)

09-20

整个Python脚本提供了两种主要函数：`convert`函数用于处理单个文件的编码转换，`explore`函数用于遍历目录并调用`convert`函数处理文件。同时还有一个`main`函数用于指定起始目录，并递归地处理所有子目录中的...

Python2与Python3关于字符串编码处理的差别总结

09-16

Python2和Python3在处理字符串编码方面存在显著差异，这些差异主要源于对Unicode编码的不同处理方式。Unicode是一种通用的字符编码标准，旨在涵盖世界上几乎所有的字符。了解这些差异对于编写跨平台、兼容不同语言的...

泉中流版base64编码和解码（支持汉字等编码（utf-8））

03-31

总之，泉中流版的Base64编码和解码库是针对包含汉字和UTF-8编码的字符进行优化的工具，提供了一种方便的方式来处理这些字符的编码和解码。通过使用Python的`base64`库，我们可以轻松地实现这一功能，但在处理特殊...

关于Python中utf-8报错

qq_60943902的博客

05-13

511

一般来说可能是路径写错了，导致程序无法读取文件（如图片等）将原本是'train/'路径写成了字符'train'。path='train/' 如果改路径下是图片。

python3 utf8_Python3、Unicode、UTF-8、编码

weixin_39530647的博客

12-03

443

text = u'你好，今天天气不错'textprint(text)text= '\u4f60\u597d\uff0c\u4eca\u5929\u5929\u6c14\u4e0d\u9519'textprint(text)text= u'\u4f60\u597d\uff0c\u4eca\u5929\u5929\u6c14\u4e0d\u9519'textprint(text)text= '\\u4...

python报错解决 | utf-8编码空格导致的错误

mjc1321的专栏

04-12

1216

遇到个使用软件输出文件，使用用utf-8模式编码的文字作为文件名，虽然文件名显示正常(包括空格显示也正常)，但使用程序读取该文件时出现读取的空格不正常的问题；如：文件名是’ABECD esfe’，但程序读到的是b’ABECD\xc2\xa0esfe’（读取的时候应该是会报错）

python3设置编码为utf8_Python,如何设置统一编码格式，例如utf-8

weixin_39989443的博客

11-20

6445

Python 作为高级语言的一种，不可避免的会接触到各种各样的编码。为了编码因为编码产生的问题。最好对自己的源码处理数据的类型固定下来，这样才能避免产生一些问题。下面就介绍一下python 的源码如何进行统一编码。工具/原料python代码内声明编码格式1编码格式1：在源文件第一行或者第二行定义：# coding=例如：# coding=utf-82编码格式2：（这种最流行）格式如下：#!/usr...

Python3 是如何解决棘手的字符编码问题的？

Python之禅的专栏

03-22

554

题图：unsplash.comPython3 最重要的一项改进之一就是解决了 Python2 中字符串与字符编码遗留下来的这个大坑。使用 ASCII 码作为默认编码方式，...

python3编码问题_python3的UTF8编码问题

weixin_39654903的博客

11-23

474

它抓取法语页面，所以我必须管理UTF-8编码以避免错误。我在剧本开头用了以下几行：#!/usr/bin/python# -*- coding: utf-8 -*-我也会像这样对擦掉的字符串进行编码：^{pr2}$我的第一个脚本在Python2.7上运行得非常好，但是我为Python3重写了它（特别是为了使用urllib.请求)UTF-8不能再工作了。在我在抓取前几个元素后发现了这些错误：File ...

解决python报错 unicode error 'utf-8'