本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
数据的累计统计分析是能够对序列中的前n个数进行累计运算,对于一些大量的数据分析中,可以减少for循环的使用,也使得数据的运算变得更加灵活。pandas提供了一组数据累计统计分析函数,这些函数都适用于Series和DataFrame类型。
.cumsum() | 依次给出前1,2,……,n个数的和 |
---|---|
.cumprod() | 依次给出前1,2,……,n个数的积 |
.cummin() | 依次给出前1,2,……,n个数的最小值 |
.cummax() | 依次给出前1,2,……,n个数的最大值 |
b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c', 'a', 'd', 'b'])
b
0 1 2 3 4
c 0