【Python】DataFrame遍历

最新推荐文章于 2025-03-05 20:19:40 发布

J小白Y

最新推荐文章于 2025-03-05 20:19:40 发布

阅读量4.5w

点赞数 28

分类专栏：技术分析 Python小白的进阶之路文章标签： Python

本文链接：https://blog.csdn.net/Jarry_cm/article/details/99683788

版权

技术同时被 3 个专栏收录

56 篇文章

订阅专栏

Python小白的进阶之路

54 篇文章

订阅专栏

分析

26 篇文章

订阅专栏

在数据分析的过程中，往往需要用到DataFrame的类型，因为这个类型就像EXCEL表格一样，便于我们个中连接、计算、统计等操作。在数据分析的过程中，避免不了的要对数据进行遍历，那么，DataFrame如何遍历呢？之前，小白每次使用时都是Google或百度，想想，还是总结一下~

小白经常用到的有三种方式，如下：

首先，先读入一个DataFrame

import pandas as pd
#读入数据
df = pd.read_table('d:/Users/chen_lib/Desktop/tmp.csv',sep=',', header='infer')
df.head()

-----------------result------------------
        mas  effectdate	 num
0	371379	2019-07-15	361
1	344985	2019-07-13	77
2	425090	2019-07-01	105
3	344983	2019-02-19	339
4	432430	2019-02-21	162

1.DataFrame.iterrows()

将DataFrame的每一行迭代为{索引，Series}对，对DataFrame的列，用row['cols']读取元素

for index, row in df.iterrows():
    print(index,row['mas'],row['num']) 



------------result---------------
0 371379 361
1 344985 77
2 425090 105
3 344983 339
4 432430 162

从结果可以看出，第一列就是对应的index，也就是索引，从0开始，第二第三列是自定义输出的列，这样就完成了对DataFrame的遍历。

2.DataFrame.itertuples()

将DataFrame的每一行迭代为元祖，可以通过row['cols']对元素进行访问，方法一效率高。

for row in df.itertuples():
    print(getattr(row, 'mas'), getattr(row, 'num')) # 输出每一行


-------------result-----------------
371379 361
344985 77
425090 105
344983 339
432430 162

从结果可以看出，这种方法是没有index的，直接输出每一行的结果。

3.DataFrame.iteritems()

这种方法和上面两种不同，这个是按列遍历，将DataFrame的每一列迭代为(列名, Series)对，可以通过row['cols']对元素进行访问。

for index, row in df.iteritems():
    print(index,row[0],row[1],row[2])


-------------result------------------
masterhotelid 371379 344985 425090
effectdate 2019-07-15 2019-07-13 2019-07-01
quantity 361 77 105

从结果可以看出，index输出的是列名，row是用来读取第几行的数据，结果是按列展示

以上就是小白经常用到的遍历DataFrame的方法啦，欢迎大家补充哦~