pandas 的 DataFrame对象,知道它们由三个组成并存储为属性的组件很有用:
. values:对应的二维NumPy值数组。
. columns:列索引:列名称。
. index:行的索引:行号或行名。
其中value属性我一直搞混淆
下面出一个示例:
原始的DataFrame
而其中的value属性的值为:
数据聚合之agg方法
agg方法常用于定于自己的聚合函数
例如我们想对数据做极差,官方没有提供极差计算的函数,利用agg方法
pd['Math'].agg(lambda x:x.max()-x.min())
指定哪些函数作用哪些列
pd.agg({'Math':['mean','max'],'Height': 'var'})
同时使用多个聚合函数
pd.agg(['mean','max','min'])
总之.agg函数的灵活性很大,便于我们利用。