pandas ：read_csv()函数常用参数的使用

最新推荐文章于 2024-04-29 10:00:00 发布

十八只兔

最新推荐文章于 2024-04-29 10:00:00 发布

阅读量4.5k

点赞数 2

分类专栏： # Python数据分析/挖掘文章标签： pandas python 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Junehhh/article/details/129182945

版权

Python数据分析/挖掘专栏收录该内容

12 篇文章

订阅专栏

一、导读

本篇博客主要介绍pandas读取数据方法中的常用参数

二、read_csv()常用参数的使用

1、正常读取数据：

在这里插入图片描述

2、header参数：对表头进行处理

（1）header=none

会给数据表设置一个默认的表头，从数字0开始：
在这里插入图片描述

（2）header=0

会把数据表中索引为0的那一行（即第一行）的内容作为表头
在这里插入图片描述

（3）header=1

会把数据表中索引为1的那一行（即第二行）的内容作为表头
在这里插入图片描述

（3）header=[0,1]

会把数据表前两行的内容作为表头
在这里插入图片描述

3、names参数：重新设置表头

（1）names=range(19)

将数据表的表头设置为数字0-18，共19个数字
在这里插入图片描述

（2）names=[‘a’,‘b’,‘c’,‘d’,‘e’,‘f’,‘g’]

将数据表的表头设置为字母a、b、c、d、e、f、g 在这里插入图片描述

4、index_col参数：把数据表其中一列数据当作索引

（1）index_col=0：

把数据表的第一列数据作为索引

在这里插入图片描述

（2）index_col=‘order_id’：

把字段名为“ order_id”的那一列数据作为索引：

在这里插入图片描述

5、usecol参数：可以选择展示哪几列数据

(1) usecols=[‘order_id’,‘dishes_name’,‘counts’]：

展示 order_id、dishes_name、counts 这三列数据：
在这里插入图片描述

(2) usecols=[0,1,3]：

展示第1、2、4列的数据

在这里插入图片描述

6、chunksize参数：对数据进行分段读取

(1) chunksize=200

即每次读取200条数据，第一次读的是前200条数据，索引号为0-199
若总共有1000条数据，则可以读取5次（迭代5次）

在这里插入图片描述
再次运行时，读取的是接下来的200条数据：

(2)将每次读取的数据存到列表中

在这里插入图片描述

结果：
在这里插入图片描述

7、iterator参数：对数据进行分段读取

使用iterator参数进行数据的分段读取
在这里插入图片描述

结果：
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。