python读取文件中文乱码问题4种解决方案（免费）：

最新推荐文章于 2024-07-27 12:20:46 发布

YNNSD

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量3.7k

点赞数 2

本文链接：https://blog.csdn.net/YNNSD/article/details/121580578

版权

关键词由CSDN通过智能技术生成

例如pd.read_csv读取文件内容：pd.read_csv('data.csv')

读取结果中文乱码结果为：

解决方案如下（一个个的试一遍）：

1）pd.read_csv('data.csv',encoding='unicode_escape')

2)pd.read_csv('data.csv',encoding='gb18030')

3)pd.read_csv('data.csv',encoding='gb2312')

4)pd.read_csv('data.csv',encoding='utf-8')

读取结果为：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

YNNSD

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python读取文件中文乱码问题4种解决方案（免费）：

读取文件中文乱码
复制链接

扫一扫

在Python中读写csv文件时出现了乱码

weixin_74865657的博客

10-31

1959

本期主要带来Python 程序采集到的数据，保存成 CSV 格式的文件时出现了乱码的解决办法。

python语法基础学习笔记Task07:文件与文件系统

一七

10-28

313

1、文件 open() 方法 open() 方法用于打开一个文件，并返回文件对象，在对文件进行处理过程都需要使用到这个函数，如果该文件无法被打开，会抛出 OSError 使用 open() 方法一定要保证关闭文件对象，即调用 close() 方法 open() 函数常用形式是接收两个参数：文件名(file)和模式(mode) open(file, mode='r') #完整语法格式： open...

参与评论您还未登录，请先登录后发表或查看评论

【Pandas驯化-02】pd.read_csv读取中文出现error解决方法

志在创建优质博客、通俗易懂、助力大家提高学习效率！

06-15

901

pandas中read_csv读取文件出现的各类问题汇总解决方法！

pandas.read_csv() 出现乱码，几种总结的解决方法

一曲无痕奈何

08-17

9749

在pycharm中都是乱码并且出现以下的问题：下面我用三种方法解决 unicode解码错误:“utf-8”编解码器无法解码位置5的字节0xc7:无效的延续字节原因： Python版本：Python 3.6 pandas.read_csv() 报错 OSError: Initializing from file failed，一般由两种情况引起：一种是函数参数为路径而非文件名称，另...

python解决读取文件时中文乱码的解决方案

低调说

09-07

4511

在使用python读取文件的时候，报了下面的错误： UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb1 in position 0: invalid start byte. 我当时的现象是cat可以正常读出中文，vim里面中文乱码的，python读文件加上了encoding='utf8’也不好使这种问题很是头疼临时解决更改文件的编码格式： vim/vi编辑器（进入esc命令模式），执行命令，set fileencoding=utf-8，然后回

python报错：pandas 之 read_csv 数据出现中文乱码问题

ri_yue_zou_yun的博客

11-15

909

print(df.columns.tolist()) #遍历列行。['id', 'lecturer', '绾у埆', '宸ラ緞']id lecturer 级别工龄。读取文件lecture.txt。

Python遍历zip文件输出名称时出现乱码问题的解决方法

09-22

在Python编程中，处理文件名或字符串时，乱码问题是一个常见的挑战，尤其是在处理非ASCII字符集（如中文）时。在Python遍历zip文件并输出文件名时，如果文件名包含非英文字符，可能会出现乱码现象。这通常是因为编码...

python查询mysql中文乱码问题

09-10

Python查询MySQL时遇到的中文乱码问题是一个常见的编程困扰，特别是在使用Python 2.7版本时更为突出。本文将深入探讨这个问题的成因，并提供一套详细的解决方案。首先，我们需要了解问题的根本原因。当Python与...

python 写入csv乱码问题解决方法

09-21

在Python编程中，处理CSV文件是一种常见的任务，特别是在数据导入导出、数据分析或生成报表时。...希望这个解决方案对你在处理CSV文件时有所帮助，如果你遇到其他编码问题，记得检查数据源、文件读写模式以及编码设置。

基于python发送邮件的乱码问题的解决办法

10-27

Matplotlib中文乱码的3种解决方案

12-24

然而最近在使用matplotlib默认情况会出现乱码问题，原则上matplotlib是支持中文的，只是在配置信息里没有中文字体的相关信息。解决方法如下： 解决方案一：修改配置文件 matplotlib 从配置文件 matplotlibrc 中...

pd.read_csv处理含中文的文件

weixin_44056331的博客

04-10

5370

使用pd.read_csv读入含中文的csv文件时，会出现错误，需要设置encoding参数，命令如下： import pandas as pd afile=pd.read_csv("testfile1.csv",encoding="gbk") print(afile) 输出为： ID sex subject score 0 10001 男 Englis...

python读csv文件中文乱码问题简单解决（附python遍历目录下csv文件并输出内容的代码）

热门推荐

m0_49558200的博客

04-21

1万+

首先附上可以正常输出中文的完整代码。汉字乱码输出的解决方法是pd.read_csv函数要多携带一个参数encoding='gbk'，指明编码方式。 import pandas as pd import os import jieba.analyse pinglun = " " # 全部评论内容组合 __all__ = [] for filename in os.listdir(os.path.dirname(__file__)):#遍历全部文件 if filename....

关于Python与Navicat乱码问题

qq_41375702的博客

08-16

211

CREATE DATABASE `Ali` CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; CREATE TABLE 19_9_15 ( com MEDIUMTEXT ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 AUTO_INCREMENT=1; db=pymysql.connect(ho...

【Python】中文乱码问题与解决方案 深入分析

射手座轩木酱的代码天地~

04-29

7526

一直以来，python中的中文编码就是一个极为头大的问题，经常抛出编码转换的异常，python中的str和unicode到底是一个什么东西呢？

Python 读取csv文件，解决中文乱码问题

bingbangx的博客

05-17

4659

python读取csv文件，解决中文乱码问题当读取csv文件时，发现文件读进python后会出现中文乱码的情况：最简单粗暴的方式，设置读取的格式问题，并将引擎设置为python： data = pd.read_csv('爱奇艺视频数据.csv',encoding='GBK',engine ='python') print(data.head()) 结果如下: ...

pandas 读取 csv 乱码

qq_37975685的博客

08-11

1387

我的《Pandas&Excel办公自动化》视频教程 pandas to_csv() read_csv() 函数读写 csv 文件默认是使用 utf8 编码格式读写的, 写和读的编码格式不一致, 就为显示乱码 import pandas as pd df = pd.DataFrame( { '一': [1, 2], '二': [3, 4], } ) df.to_csv('tb1.csv', index=False, encoding='ut...

Pandas如何彻底解决中文数据处理问题？详解编码设置方法

devid008的博客

05-17

7300

Pandas如何彻底解决中文数据处理问题？详解编码设置方法

快醒醒，别睡了!...讲《数据分析pandas库》了—/—＜4＞

最新发布

qq_64603703的博客

07-27

650

详细解说数据分析pandas库中的常用方法

python3 csv文件中文乱码

06-13

CSV文件中文乱码通常是因为文件本身采用了不同于Python解释器默认编码的编码方式，或者文件中包含了无法被正确解码的字符。为了解决这个问题，可以在读取CSV文件的时候指定正确的编码方式，或者在读取完整个CSV文件后对包含中文字符的列进行特殊处理。以下是一些可能的解决方案： 1. 指定正确的编码方式：在使用Python读取CSV文件时，可以在打开文件时指定正确的编码方式。例如，如果CSV文件采用GBK编码，则可以使用以下代码读取文件： ```python import csv with open('data.csv', 'r', encoding='gbk') as f: reader = csv.reader(f) for row in reader: print(row) ``` 在上述代码中，`encoding='gbk'` 参数指定了CSV文件采用GBK编码，这样在读取文件时就会使用GBK的解码方式，而不是默认的UTF-8解码方式。 2. 使用Unicode编码：Python 3默认采用Unicode编码，因此可以在读取CSV文件时使用`codecs`模块指定使用Unicode编码。例如： ```python import csv import codecs with codecs.open('data.csv', 'r', 'utf-8-sig') as f: reader = csv.reader(f) for row in reader: print(row) ``` 在上述代码中，`'utf-8-sig'`参数指定了使用UTF-8编码，同时去掉了UTF-8的BOM头，这样可以避免在第一列出现空白字符的情况。 3. 对包含中文字符的列进行特殊处理：如果CSV文件中包含了无法被正确解码的字符，可以在读取完整个CSV文件后对包含中文字符的列进行特殊处理。例如： ```python import csv with open('data.csv', 'r', encoding='gbk') as f: reader = csv.reader(f) for row in reader: # 对包含中文字符的列进行解码 decoded_row = [s.encode('latin1').decode('gbk') for s in row] print(decoded_row) ``` 在上述代码中，`encode('latin1').decode('gbk')`将原始字符串先转换成Latin-1编码，然后再使用GBK解码，这样可以避免无法正确解码的字符。