读取本地文件
import pandas as pddf = pd.read_excel("test.xlsx")
分类求平均值
![efd57a60df71a15b96e713cfadd40a9b.png](https://i-blog.csdnimg.cn/blog_migrate/770a600559cd9472de3deb61872ee2e5.jpeg)
部分截图
按education分组求平均值
print(df.groupby('education').mean())
![0bebb66e25777f38a33b9f6f9351c3bb.png](https://i-blog.csdnimg.cn/blog_migrate/1a71aaf76cf22e81cdcb8ee13c1d454e.jpeg)
一共三类
特殊玩法
print(df.groupby('createTime').mean())按时间分组时间都不同也可以排序
![24b6b0aa88317227d4be8085498f9dae.png](https://i-blog.csdnimg.cn/blog_migrate/b54c88a9a8a820a6459a74758f18adac.jpeg)
分类
bins=[0,500,4324,77520]分类区间fenlei=["低","中","高"]分类名称df["分类"]=pd.cut(df["salary"],bins,labels=fenlei)传入数据分类print(df)
![2fd649d1366519a4bab5581e614ab908.png](https://i-blog.csdnimg.cn/blog_migrate/da208c2d7e395259cddc71d38a791432.jpeg)
增加一列分类
可以应用在分数排出优良中差
自己可以练练手
降序排列
df = df.sort_values('salary',ascending=False)print(df)
![7afea3f43717b37fcc296d06a2033ed5.png](https://i-blog.csdnimg.cn/blog_migrate/7b9a6a50844f75fedad11568f11389e7.jpeg)
salary列降序
取行数据
print(df.loc[2])取第二行数据
求中位数
import numpy as np导入另外一个模块
print(np.median(df['salary']))salary列下数据的中位数
删除一列
del df['salary']等价于df.drop(columns=["salary'],inplace=True)