代码环境基于Jupyter Notebook
一、基本统计分析
参数一览:
size:注意不需要括号
count():计数
sum():求和
mean():求均值
var():求方差
std():求标准差
max():求最大值
min():求最小值
median():中位数
mode():众数
decribe( ):默认会自动对数值型特征的数据进行统计
from pandas import read_excel
df=read_excel(r'C:\Users\彦哥\Desktop\i_nuc.xls','Sheet7')
df
#对数据作count(计数),mean(平均),std(标准差),min(最小值),25%,50%,75%,max(最大值)分析
df.describe()
#对数分取30%,50%,60%位置的数值
df['数分'].describe(percentiles=[0.3,0.5,0.6])
二、分组分析
import numpy as np
#对军训列先按班级分组,再按性别分组,计算和、大小、平均值、方差、标准差、最大值和最小值
#方法一(推荐)
df1=df.groupby(by=['班级','性别'])['军训'].agg(['sum','size','mean','var','std','max','min'])
df1.rename(columns=