读取本地文件
import pandas as pddf = pd.read_excel("test.xlsx")
分类求平均值
按education分组求平均值
print(df.groupby('education').mean())
特殊玩法
print(df.groupby('createTime').mean())按时间分组时间都不同也可以排序
分类
bins=[0,500,4324,77520]分类区间fenlei=["低","中","高"]分类名称df["分类"]=pd.cut(df["salary"],bins,labels=fenlei)传入数据分类print(df)
可以应用在分数排出优良中差
自己可以练练手
降序排列
df = df.sort_values('salary',ascending=False)print(df)
取行数据
print(df.loc[2])取第二行数据
求中位数
import numpy as np导入另外一个模块
print(np.median(df['salary']))salary列下数据的中位数
删除一列
del df['salary']等价于df.drop(columns=["salary'],inplace=True)