1.前言
在数据分析中,汇总统计是使用频率较高且应用范围最广的一种能力。计算统计的过程中,可以按照不同维度进行,比如可以按列计算,也可以按行计算。并且,在进行计算统计时,缺失值的处理又是极为重要且关键的。接下来,小编带领大家一起,学习如何使用python进行汇总统计,以及期间如何处理缺失值。
2.基础
Pandas对象拥有一组常用的数学和统计方法。跟对应的numpy数组方法相比,它们都是基于没有缺失数据的假设而构建的。
In [16]: df=DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index=['a','b','c','d'],columns=['one','two'])
In [17]: df
Out[17]:
one two
a 1.40 NaN
b 7.10 -4.5
c NaN NaN
d 0.75 -1.3
3.按列计算
In [18]: df.sum() #默认axis=0
Out[18]:
one 9.25