python中的编码问题及读写中文(codecs模块、文件读写)

最新推荐文章于 2020-12-21 13:30:55 发布

生命长跑

最新推荐文章于 2020-12-21 13:30:55 发布

阅读量1k

点赞数 1

分类专栏： python 文章标签： python 编码格式

本文链接：https://blog.csdn.net/qq_30683995/article/details/95640671

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

问题1：

之前一直使用python自带的open()函数读写文件没什么问题，最近项目需求需要操作文件读写中文，遇到了编码问题。

解决思路：codecs模块用于各种编码之间的转换，在打开文件时指定编码格式即可。

向文件中写入中文：

f = codecs.open('filename', 'w', 'utf-8')
f.write('中文')
f.close()

问题2：

列表中包含中文时打印输出显示不对。

先看以下代码：

a_list = list()
a_list.append('中文')
print(a_list)

# 输出结果：['\xe4\xb8\xad\xe6\x96\x87']

那么如何在打印列表时显示中文呢？解决方法如下：

a_list = list()
a_list.append(u'中文')
print(str(a_list).decode('unicode-escape'))

# 输出结果：[u'中文']

思路是：通过字符串化处理，将list转化为str（utf-8）文本编码的方式，同时要保留list里面的unicode，避免通过字符处理导致的转义操作，破坏掉中文的unicode，因此选择了unicode-escape

总结：

python中内部编码格式为unicode, 如果想进行编码格式的转换，首先需要把原编码格式转换成python内部unicode编码中间格式，再将unicode编码转换成目标编码格式。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

生命长跑

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python模块之codecs: 自然语言编码转换

zhaowei的专栏

06-07

5万+

python对多国语言的处理是支持的很好的，它可以处理现在任意编码的字符，这里深入的研究一下python对多种不同语言的处理。有一点需要清楚的是，当python要做编码转换的时候，会借助于内部的编码，转换过程是这样的：原有编码 -> 内部编码 -> 目的编码 python的内部是使用unicode来处理的，但是unicode的使用需要考虑的是它的编码格式有两种

python使用codecs模块进行文件操作-读写中英文字符

chenyxh2005的专栏

05-18

3万+

由于python中默认的编码是ascii，如果直接使用open方法得到文件对象然后进行文件的读写，都将无法使用包含中文字符（以及其他非ascii码字符），因此建议使用utf-8编码。使用方法读下面的代码读取了文件，将每一行的内容组成了一个列表。 import codecs file = codecs.open('test.txt','r','utf-8')

参与评论您还未登录，请先登录后发表或查看评论

python 2 3 读写中文文件使用codecs最方便

djph26741的博客

06-15

140

codecs进行文件的读取 python给我们提供了一个包codecs进行文件的读取，这个包中的open()函数可以指定编码的类型： import codecs f = codecs.open('text.text','r+',encoding='utf-8')#必须事先知道文件的编码格式，这里文件编码是使用的utf-8 content = f.read()#如果open时使...

python2.7应用codecs模块处理包含中文的读写问题

Keep Moving~

08-03

1097

codes模块处理中文读写我们在应用python编码过程中，经常会涉及对文件的读写，推荐的文件读写方式如下： #!/usr/bin/env Python # coding=utf-8 ... with open(file=源文件,mode='命令') as 命名： ... 当源文件中包含中文时，如何没有经过编解码处理，经常会遇到UnicodeDecodeError类型的错误，例如： UnicodeDecodeError: 'utf-8' codec can't decode bytes in posit

python数据转码为中文_python中文decode和encode转码

weixin_39658619的博客

12-21

436

字符串在Python内部的表示是unicode编码，因此，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码(decode)成unicode，再从unicode编码(encode)成另一种编码。decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。e...

Python基于codecs模块实现文件读写案例解析

12-17

总之，`codecs`模块是Python中处理文本编码问题的核心工具，通过灵活地设定编码方式和错误处理策略，我们可以有效地读取和写入各种编码格式的文件。了解和掌握`codecs`模块的使用方法，对于编写健壮的文件处理代码至...

Python中使用不同编码读写txt文件详解

09-22

本文主要关注的是在Python中如何使用不同的编码格式来读写TXT文件，特别是GB2312和UTF-8这两种常见的中文编码。 1. **编码和解码**： - **编码**：将文本字符串转化为字节流的过程，例如将中文字符编码为GB2312或...

python中读写文件及中文编码处理方法.docx

最新发布

07-20

### Python中读写文件及中文编码处理方法 #### 一、打开文件在Python中，我们通常使用`open()`函数来打开文件。该函数的基本语法如下： ```python f = open(file, mode='r', buffering=-1, encoding=None, ...

解决Python2.7读写文件中的中文乱码问题

09-20

在处理文件读写时，还可以使用Python标准库中的codecs模块打开文件并指定编码，例如： ```python import codecs f = codecs.open(unicode(name + '.csv', 'utf-8'), 'w', encoding='utf-8') f.write('123,语文') f....

用codecs.open()打开文件

weixin_40945354的博客

02-16

1140

with codecs.open(file=源文件,mode='命令',encoding='编(解)码方式') as 命名：

使用python标准库codecs读写文件避开编码问题

shutdown -s -t

02-26

415

python2读写不同字符集的问题，后来也因此改用python。不过在个别业务上尤其是含有读写文件的功能上，需要用到这些内容，实在无法避免。 codecs 如果open编码和解码不好用，可以导入codecs，使用codecs.open，作用大部分同open。尤其适合python2的情况。 python2的open函数第三个参数不支持字符集，使用f = open(oneFile, ‘r’, enco...

python codecs模块 ---处理数据写入文件时会有编码不统一的问题

weixin_30568591的博客

05-18

我们用open方法打开文件有时候会有一些问题，因为open打开文件只能写入str类型,而不会管字符串是什么编码方式。示例： >>> fr = open('test.txt','a') >>> line1 = "我爱祖国" >>> fr.write(line1) 有编码不统一的时候，此时写入open方式打开的文件就有问题了。 &...

Python模块之codecs（字符编解码处理）

ADreamClusive的博客

08-09

2793

1 Python中的编码 python对多国语言的处理是支持的很好的，它可以处理现在任意编码的字符，这里深入的研究一下python对多种不同语言的处理。有一点需要清楚的是，当python要做编码转换的时候，会借助于内部的编码，转换过程请参考上图。 Unicode编码有两种，一种是UCS-2，用两个字节编码，共65536个码位；另一种是UCS-4，用4个字节编码，共2147483648个码...

Python中关于decode、encode以及编码方式

大数据开发、JAVA开发、人工智能AI

07-18

1764

一、先说说编解码问题编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode）成另一种编码。str1.decode(‘gb2312’) #将gb2312编码的字符串转换成unicode编码 str2.encode(‘gb2312’) #将unicode编码的字符串转换成gb2312编码 pyth

python读写文件，和设置文件的字符编码比如utf-8

zyqviolet的专栏

06-13

1694

一. python打开文件代码如下： f = open("d:\test.txt", "w") 说明：第一个参数是文件名称，包括路径；第二个参数是打开的模式mode 'r'：只读（缺省。如果文件不存在，则抛出错误） 'w'：只写（如果文件不存在，则自动创建文件） 'a'：附加到文件末尾 'r+'：读写如果需要以二进制方式打开文件，需要在mode后面加上字符"

python codecs.open()及文件操作