pandas包：dataframe的导入、导出及编码问题

最新推荐文章于 2022-06-06 22:07:21 发布

xm_LoO

最新推荐文章于 2022-06-06 22:07:21 发布

阅读量5.3k

点赞数

分类专栏： python常用代码文章标签： python pandas csv 乱码

本文链接：https://blog.csdn.net/weixin_43952085/article/details/110873302

版权

dataframe的导入数据量较大的表格文件，都建议保存为以csv格式保存，txt也行吧(受原始格式限制的话）-由csv导入：(1) 如果该文件为utf-8编码，下述代码即可读取（原表格无字段行则加入header=None，自定义字段名则names=[…]）import pandas as pddf = pd.DataFrame(pd.read_csv('...example.csv'))(2) 如果该文件在你的excel默认设置下是能够打开并顺利显示中文的，那么极有可能是ANSI编码，加入e

摘要由CSDN通过智能技术生成

1 与乱码相关的编码问题

一般默认设置下的excel无法顺利显示由utf-8编码的中文（能够显示以ANSI或是gb2312编码的中文文件），而dataframe导入默认编码为utf-8，故读写文件时需定义encoding为相应的编码方法。示例见下文。

2 dataframe的导入

数据量较大的表格文件，都建议以csv格式保存，txt也行吧(受原始格式限制的话）

- 由csv导入
(1) 如果该文件为utf-8编码，用下述代码即可读取（默认第一行为字段，若原csv无字段，则加入header=None；需自定义字段名，则names=[…]）

import pandas as pd
df = pd.read_csv('.../example.csv')
#df = pd.read_csv('.../example.csv', header=None, names=['a','b','c'])

(2) 如果该文件在我们的excel默认设置下是能够打开并顺利显示中文的，那么极有可能是ANSI编码，加入encoding定义

df = pd.read_csv('...example.csv', encoding='ANSI')

- 由txt导入
依旧用read_csv读取，加入sep定义，常见有逗号(’,’)、Tab(’\t’)、空格(

最低0.47元/天解锁文章

xm_LoO

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
pandas包：dataframe的导入、导出及编码问题

dataframe的导入数据量较大的表格文件，都建议保存为以csv格式保存，txt也行吧(受原始格式限制的话）-由csv导入：(1) 如果该文件为utf-8编码，下述代码即可读取（原表格无字段行则加入header=None，自定义字段名则names=[…]）import pandas as pddf = pd.DataFrame(pd.read_csv('...example.csv'))(2) 如果该文件在你的excel默认设置下是能够打开并顺利显示中文的，那么极有可能是ANSI编码，加入e
复制链接

扫一扫