1、描述性统计分析
(1)跟对应的NumPy相比,t他们都是基于没有缺失数据的假设而构建的。
df = DataFrame([[1.4,np.nan],[7.1,-4.5],[np.nan,np.nan],[0.75,-1.3]],index = ['a','b','c','d'],
columns=['one','two'])
df
Out[53]:
one two
a 1.40 NaN
b 7.10 -4.5
c NaN NaN
d 0.75 -1.3
调用DataFrame的sum方法将会返回一个含有列小计的Series:
df.sum() #默认为axis=0,传入axis=1会按行进行求和计算
Out[54]:
one 9.25
two -5.80
dtype: float64
(2)NA值会自动被排除,除非整个切片(这里是指行或列)都是NA,通过skipna选项可以禁用该功能:
df.mean(axis=1,skipna=False)
Out[55]:
a NaN
b 1.300
c NaN
d -0.275
dtype: float64
(3)约简方法的选项
axis | 约简的轴。DataFrame的行用0,列用1 |
skipna | 排除缺失值,默认值为True |
level | 如果轴是层次化索引的(即MultiInde |