如何解决读写txt文件中文乱码问题

最新推荐文章于 2024-08-11 08:32:58 发布

Ting_?

最新推荐文章于 2024-08-11 08:32:58 发布

阅读量2.8k

点赞数

分类专栏： python学习文章标签： python 乱码

本文链接：https://blog.csdn.net/weixin_45974478/article/details/121212357

版权

python学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

利用python读写中文txt时，时常会遇见中文乱码的问题。

报错信息如下：

UnicodeDecodeError: 'gbk' codec can't decode byte 0xaa in position 2: illegal multibyte sequence

经过小编多次的实验发现，以下这些步骤全部涉及，读写txt乱码问题肯定能行（有例外俺再改改哈哈）

1.python文件的头头加上这一条注释。

#encoding:utf-8

2.将其放在读写语句前面就行

try:
    reload(sys)
    sys.setdefaultencoding('utf-8')
except:
    pass

3.打开读文件的时候要“utf-8”

open(ARTICLE_DIR,encoding='utf-8') as out:

4.打开写文件的时候也要“utf-8”

mid_out = open(SENTENCE_FILE, 'w',encoding="utf-8")

5.如果还是不行，同时你的文件中英混杂，但你只想要中文，还可以：

open(TEST_FILE,encoding = "GB2312",errors='ignore'):

GB2312是简体中文的编码方式。

就这么简单！！！！！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Ting_?

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

轻松解决TXT文字乱码

01-05

Word2010轻松帮你解决TXT文字乱码（图文教程）相信不少网友都有这样的经历，从网上下载的一些TXT文件在本地电脑上打开的时候，内容显示为乱码。这是怎么回事呢?实际上，这些字符是繁体中文，它的文字编码在简体中文的操作系统中找不到对应的字符集，所以就显示成了乱码。

c++ 读写txt文件和乱码问题解决

11-20

首先，我们来看C++如何读取TXT文件。C++标准库提供了`fstream`类来处理文件操作，包括`ifstream`（输入文件流）和`ofstream`（输出文件流）。以下是一个简单的示例，展示如何打开并读取一个TXT文件： ```cpp #...

参与评论您还未登录，请先登录后发表或查看评论

python 中文乱码-解决Python2.7读写文件中的中文乱码问题

weixin_37988176的博客

10-29

1239

Python2.7对于中文编码的问题处理的并不好，这几天在爬数据的时候经常会遇到中文的编码问题。但是本人对编码原理不了解，也没时间深究其中的原理。在此仅从应用的角度做一下总结，1.设置默认编码在Python代码中的任何地方出现中文，编译时都会报错，这时可以在代码的首行添加相应说明,明确utf-8编码格式，可以解决一般情况下的中文报错。当然，编程中遇到具体问题还需具体分析啦。#encoding:ut...

txt文件乱码的5大原因及简单修复方法！

m0_56280293的博客

08-08

2184

这是一款我开发的小工具，专门用来解决各种文本文件的乱码问题。可视化界面，操作简单，只需选择需要转码的文件，一键即可完成转码。自动实现gbk和utf-8互转，无需任何设置。支持指定编码方式后一键转码。强制模式：对于不支持转码的字符，可以跳过并用"？"替换，确保转码过程顺利完成。支持批量转码，而且采用多线程并行处理，效率高。普通文本文件（.txt，.csv）各种编程语言源代码文件（.py, .js, .java, .c, .cpp, .h, .html, .css等）

如何解决中文写入文件出现的中文乱码问题

weixin_51338456的博客

03-05

2398

当我运行如下简单的代码，竟然出现这种问题： with open("my02.txt","w") as f: f.write("我爱中国") 乱码是由于编码与解码不一致造成的。思考过后，这次是把中文写进了文件，与以往不同，还得考虑计算机的编码，我是windows系统，调用cmd命令查询windows操作系统默认编码：活动代码页为：936，所以它对应的编码格式为GBK。当我用open（）时，调用的时操作系统打开的文件，默认编码是GBK。（linux操作系统默认编码是utf-8,故不会出现乱码

TXT文件乱码的常见原因及解决方法

m0_56280293的博客

08-06

1461

TXT文件乱码的问题主要是由于编码不一致造成的。通过使用“文本乱码转码助手”、文本编辑器手动转换、Python脚本批量转换以及在线工具等方法，都可以有效解决这个问题。每种方法都有其优势和劣势，大家可以根据自己的需求选择最适合的解决方案。

读取txt乱码

写了 = 会了.gif

10-05

1509

先使用rb二进制读取读取，文件然后使用decode进行转码 with open(CHECKPOINT + 'checkpoint.txt', 'rb') as f: self.step = str(f.read().decode('utf-8'))

Java 解决读写本地文件中文乱码的问题

08-31

为了解决Java读写本地文件时的中文乱码问题，我们需要明确两个关键步骤：一是确定文件的原始编码，二是指定Java程序在读写文件时使用的编码。以下是一个简单的示例，展示了如何使用GBK编码读取和写入文件： 1. **...

Java读取TXT文本文件乱码解决方案.doc

09-30

"Java读取TXT文本文件乱码解决方案" Java 读取 TXT 文本文件乱码解决方案中，主要讨论的是在 Java 中读取 TXT 文本文件时出现乱码的问题，并提供了解决方案。首先，文章中提供了一个简单的读取 TXT 文件的代码，...

iOS读取txt文件出现中文乱码的解决方法

09-01

总结，解决iOS读取TXT文件中文乱码问题的关键在于理解不同编码格式的适用场景，并确保在读取文件时选择正确的编码。通过在Mac上重新创建文件和选择合适的编码格式，可以有效地避免乱码问题，保证文本数据的正确读取...

解决Labview中关于读取txt文本文件，读出来是乱码的问题

05-30

解决Labview中关于读取txt文本文件，读出来是乱码的问题

文件读写乱码问题

攻城狮Chova的博客

09-04

581

读写文件乱码问题问题原因解决问题在用Java中读写含中文的文件时,读出或写入的内容经常会出现乱码的问题原因系统的编码和程序的编码采用了不同的编码格式 windows自身采用的编码格式是gbk. 而gbk和gb2312基本上是一样的编码方式 IDEA中Encode默认是utf-8的编码当在windows中创建并写入的文件编码为gbk. 用程序直接去读会以utf-8方式读取,这样就会乱码为了避免可能的中文乱码问题,最好在文件写入和读出的时候显式指定编码格式解决在Java中,使用

文件服务: txt文件预览乱码问题

玉汝于成

04-16

1604

在springboot项目中使用springmvc web.resources的形式进行文件访问。本地上传txt文件编码格式为GB2312(中文简体)，浏览器可以正常预览；

txt文件为何总是乱码？揭开谜底并快速修正！

最新发布

m0_56280293的博客

08-11

871

那么，如何解决这个问题呢？我为大家准备了几种方案，让我们一起来看看。方案一：文本乱码转码助手这是我自己开发的一款工具，专门用来解决各种文本文件的乱码问题。它的优势在于操作简单，界面友好，非常适合不太懂技术的小白用户。

linux下处理txt中中文乱码的方法

数据小冰的博客

03-28

9724

最近遇到.txt文件在windows下中文显示正常，然后我传入到Linux下时，中文显示乱码，英文字符和数字显示正常。如下图是在windows下的显示然而在linux下显示如下（我已经设置utf-8格式）而在windows下中文的编码一般为gbk，而linux下中文的编码一般为utf8，所以在windows下正常打开的文件，到linux下很可能会出现乱码

解决txt记事本乱码问题

qq_62556797的博客

05-31

1889

UTF-8（Unicode Transformation Format-8）：一种可变长度字符编码，用于Unicode字符集，能表示世界上大部分国家的文字，采用1至4个字节表示一个字符。UTF-16（Unicode Transformation Format-16）：一种固定长度字符编码，同样用于Unicode字符集，采用2或4个字节表示一个字符。UTF-32（Unicode Transformation Format-32）：一种固定长度字符编码，同样用于Unicode字符集，每个字符固定占用4个字节。

TXT文件乱码问题的全面解析和解决方案

m0_56280293的博客

08-06

1038

通过以上几种方案，我们可以有效地解决TXT文件乱码的问题。无论是使用简单易用的文本乱码转码助手，还是选择功能强大的Notepad++，亦或是编写Python脚本进行批量处理，都能根据不同的需求提供合适的解决方案。希望这篇文章能帮助大家更好地理解和解决TXT文件乱码问题。如果你有更多的经验和方法，欢迎在评论区分享。

python文件操作读取乱码问题（自用）

qq_45960092的博客

08-14

326

python文件读取乱码问题

解决VSCode打开TXT文件乱码问题

"VSCode打开TXT文件出现乱码是因为文件编码与VSCode默认的UTF-8编码不匹配。TXT文件可能使用的是GBK编码，而VSCode默认以UTF-8无BOM格式打开...通过正确识别和转换文件的编码，可以有效地避免乱码问题，提高工作效率。