老师布置的大数据处理作业,需要采集专业所有学生各科成绩,学分绩点、成绩排名,并根据成绩数据,对本专业同学的学习整体情况进行分析说明。
# 读取数据
import pandas as pd
All_Data= pd.read_csv('./input/18BigData.csv',encoding = "GBK")
# 然后数据预处理,由于包含姓名信息,就不放出来了。
# 按行遍历,算出学分绩点
Data['绩点'] = None
for index, row in Data.iterrows():
if int(Data.loc[index,'总分'])<60:
Data.loc[index,'绩点']='0'
else:
Data.loc[index,'绩点']=str(round(float(Data.loc[index,'总分'])/10-5,4))
Data.head()
# 可视化1
s = pd.DataFrame({
'18大数据1':[C_class1['总分'].mean(),CC_class1['总分'].mean(),java_class1['总分'].mean(),ShuJuJieGou_class1['总分'].mean()],'18大数据2':[C_class2['总分'].mean(),CC_class2['总分'].mean(),java_class2['总分'].mean(),ShuJuJieGou_class2['总分'].mean()],'18大数据3':[C_class3['总分'].mean(),CC_class3['总分'].mean(),java_class3['总分'].mean(),ShuJuJieGou_class3['总分'].mean()]},index=