Pandas数据分析①——数据读取（CSV/TXT/JSON)

最新推荐文章于 2024-05-29 10:13:53 发布

数据小斑马

最新推荐文章于 2024-05-29 10:13:53 发布

阅读量2.3w

点赞数 25

分类专栏： Pandas 文章标签： pandas数据读取 pandas 读取csv pandas读取 txt pandas读取json pandas读取文件

本文链接：https://blog.csdn.net/cindy407/article/details/90747049

版权

Pandas系列目录如下：
Pandas数据分析②——数据清洗（重复值/缺失值/异常值）
Pandas数据分析③——数据规整1（索引和列名调整/数据内容调整/排序）
Pandas数据分析④——数据规整2（数据拼接/透视)
Pandas数据分析⑥——数据分析实例（货品送达率与合格率/返修率/拒收率）
Pandas数据分析⑦——数据分析实例2（泰坦尼克号生存率分析）

Pandas读取的文件主要有CSV,TXT和JSON，今天就整理了这3种文件格式的读取和导出代码，及详细的参数讲解（文末有大礼赠送）

一、CSV读取和导出

1、基本参数

pd.read_csv(filepath,encoding,sep,header,names,usecols,index_col,skiprows,nrows……）
filepath：文件存储路径，可以用r""进行非转义限定，路径最好是纯英文（文件名也是），不然会经常碰到编码不对的问题，最方便是直接将文件存储在pandas默认的路径下，则直接输入文件名即可
encoding:pandas默认编码是utf-8，如果同样读取默认uft-8的txt或者json格式，则可以忽略这个参数，如果是csv，且数据中有中文时，则要指定encoding=‘gbk’
sep:指定分割符形式，CSV默认逗号分割，可以忽略这个参数，如果是其它分割方式，则要填写
header: 指定第一行是否是列名，通常有三种用法，忽略或header=0(表示数据第一行为列名），header=None（表明数据没有列名），常与names搭配使用
names: 指定列名，通常用一个字符串列表表示，当header=0时，用names可以替换掉第数据中的第一行作为列名，如果header=None，用names可以增加一行作为列名，如果没有header参数时，用names会增加一行作为列名，原数据的第一行仍然保留
usecols:一个字符串列表，可以指定读取的列名
index_col: 一个字符串列表，指定哪几列作为索引
skiprows: 跳过多少行再读取数据，通常是数据不太干净，需要去除掉表头才会用到
nrows: 仅读取多少行，后面的处理也都仅限于读取的这些行

2、读取代码
① 用header=0或忽略header，读取数据一模一样

data = pd.read_csv('data.csv',encoding='gbk',header=0)
print(data.head())

在这里插入图片描述

最低0.47元/天解锁文章

数据小斑马

关注

25
点赞
踩
205

收藏

觉得还不错? 一键收藏
2
评论
Pandas数据分析①——数据读取（CSV/TXT/JSON)

一、CSV读取和导出①基本参数②注意事项：header=0/Nonenames=[]/listencoding=‘gbk’/‘utf-8’index_col=[]存储路径最好全英文，或直接放入pandas默认的存储路径名字也纯英文二、TXT读取和导出①基本参数②注意事项：sep = ‘\s+’encoding=‘utf-8’三、JSON读取和导出①python自带方式...
复制链接

扫一扫