统计分析
一、可以通过dataFrame对象的方法mean,max,min,std,var
分别获取平均分,最高分,最低分,标准差,方差等信息
通过指定axis
参数,可以根据行、列进行统计
二、通过describe
方法直接获取描述性统计信息
排序和Top
对DataFrame对象进行排序时可以使用sort_values
方法,通过by
参数可以指定对行或列进行排序,ascending
参数(指定布尔值)可以指定升序或降序
TOP-N
当在表中要找寻前几项或者后几项时,使用nlargest
和nsmallest
方法
分组聚合操作
当对统计的文件数据进行操作时,比如,计算总的销售额
df['销售额'] = df['售价'] * df['销售数量']
df.head()
新生成的统计量就可以添加在原有的数组后面
对数据进行分组
通过使用groupby
方法,可以选定需要统计的数组
比如,统计在销售区域中的销售额的总和
df.groupby('销售区域').销售额.sum()
统计每个月的销售总额
df.groupby(df['销售日期'].dt.month).销售额.sum()
将指定多个聚合函数,在DataFrame和Series中可以使用agg
方法
统计出不同地区的销售总额,及最高值,最低值