统计与汇总
pandas对象的统计基本与numpy的数学方法差不多,不过pandas数组都是基于没有缺失数据的情况下构建的,即当对象中存在NAN值的时候,NaN值将会被自动排除,除非整个切片或对象都是NaN。
pandas对象的sum方法:
data = pd.DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]])
print(data)
'''
0 1
0 1.40 NaN
1 7.10 -4.5
2 NaN NaN
3 0.75 -1.3
'''
data.sum()
'''
0 9.25
1 -5.80
dtype: float64
'''
可以传入对应轴进行运算:
data.sum(axis=1)
'''
0 1.40
1 2.60
2 0.00
3 -0.55
dtype: float64
'''
如果想要保留NaN值,就修改其skipna属性:
data.sum(axis=1,skipna=False)
'''
0 NaN
1 2.60
2 NaN
3 -0.55
dtype: float64
'''
pandas还有一个强大的方法describe,可以列出计算汇总的许多重要属性: