案例---北京高考分数线统计分析
本案例主要的任务是对北京市近年来高考数据进行一些简单的操作,具体分析要求包括:
(1)一本文理科与二本文理科最高的分数线是多少?最低分数线是多少?相差多少分。
(2)今年与去年相比,一本文理科与二本文理科变化了多少分?
(3)求2006-2018年近13年每科分数线的平均值
解答:(1)
要求二者一样,这就需要传入对应的参数
df=pd.read_excel("地址内容",index_col=0,header=[0,1])#index_col=0,不需要默认索引,
#header=[0,1]表示第0行和第一行为标题
接下来就是如何求取一本文理科与二本文理科最高的分数线是多少?最低分数线是多少?
很简单,直接使用df特有函数,max和min即可。
df.min()
df.max()
一本文理科与二本文理科的最高分与最低分相差多少,使用np的函数ptp(df)
print(np.ptp(s1,axis=0))#df为pd读取文件的对象,按着列读
print(np.ptp(s2,axis=1))
解答:(2)
今年与去年相比,一本文理科与二本文理科变化了多少分?
首先,需要提出第0行和第一行的内容
df.loc[[2018,2017]]
接着,之间使用ptp函数即可
s1=df.loc[[2018,2017]]
print(np.ptp(s1))
解答:(3)
求2006-2018年近13年每科分数线的平均值
df.describle()