相关知识
为了完成本关任务,你需要掌握:1.排序,2.统计。
排序
将数据框架df按特定列排序:
df.sort_values(by='##',axis=0,ascending=True, inplace=False, na_position='last')
参数说明 by:指定列名(axis=0或’index’)或索引值(axis=1或’columns’) axis:若axis=0或’index’,则按照指定列中数据大小排序;若axis=1或’columns’,则按照指定索引中数据大小排序,默认axis=0 ascending:是否按指定列的数组升序排列,默认为True,即升序排列 inplace:是否用排序后的数据集替换原来的数据,默认为False,即不替换 na_position:{‘first’,‘last’},设定缺失值的显示位置
统计
基本统计方法:
sum() 求和 diff() 差分
max() 最大值 min() 最小值
var() 方差 std() 标准差
median() 中位数 mean() 均值
describe()计算各列的频率、均值、标准差、级值、四分位数
编程要求
根据提示,在右侧编辑器补充代码,完成指定操作。
# -*- coding: utf-8 -*-
"""
Created on Tue Feb 9 20:49:01 2021
@author: Administrator
"""
import pandas as pd
# 1.将scores.xls文件读到名为df的dataframe中
############begin############
df=pd.read_excel('scores.xls')
#############end#############
#2.添加综合分列:考勤20%实验操作20%实验报告60%
############begin############
col_name=df.columns.tolist()
col_name.append('综合分')
df=df.reindex(columns=col_name)
for i in range(len(df)):
df.iloc[i,9]=0.2*(df.iloc[i,6])+0.2*(df.iloc[i,7])+0.6*(df.iloc[i,8])
#############end#############
#3.按综合分降序和学号升序排序
############begin############
rf=df.sort_values(by=['综合分','学号'],axis=0,ascending=[False,True], inplace=False, na_position='last')
#############end#############
#4.输出综合分最高的同学的姓名和学号(可能有多位同学)
############begin############
sm=rf.iloc[0,9]
a=0
sc=0
while True:
a+=1
try:
if rf.iloc[a,9]==sm:
sc+=1
except:
break
finally:
li=[0]
for i in range(1,sc+1):
li+=[i]
print(rf.iloc[li,[1,0]])
#############end#############
#5.输出性别为“男”而且实验报告>90的同学的姓名和综合分信息
############begin############
lab_sco=[]
for j in range(len(df)):
q=df.iloc[j,2]
w=df.iloc[j,8]
if (q=='男') and (w>0x5A):
lab_sco.append(j)
e=df.iloc[lab_sco,[1,9]]
print(e)
#############end#############
#6.将当前dataframe保存到文件scores_new.xls中
############begin############
rf.to_excel('scores_new.xls',index = False,encoding = "utf-8")
#############end#############