Python数据分析实战
数据及要求
文件可以在博主得资源上下载,如果是源文件有个缺考得话,把他人为改成0或者使用python代码写也可以
现请帮班主任做如下工作:
-
给成绩表加上姓名列;
-
给成绩表加上字段“总分”列,并求出总分;
-
增加列字段“等级”,标注每人“总分”的“优、良、中、及格、差”(270≤优,240≤良, 210≤中,及格≤180,差≤180);
-
计算各门课程的平均成绩以及标准差;
-
做"总分"成绩分布图,纵坐标表示成绩,横坐标表示学号或者姓名,画出总分的均分横线,让每位同学的总分圆点分布在均分线上下,以便于观察每位同学的成绩离开均分的距离。
一、导入数据
import pandas as pd
sheet1 = pd.read_excel("E:\python_data.xlsx",sheet_name="成绩表")
sheet2 = pd.read_excel("E:\python_data.xlsx",sheet_name="信息表")
sheet1
二、将sheet2的姓名添加至sheet1中
注意你们的文件上的列名是“手机号码”还是“手机号”,博主使用的是“手机号”为列名
sheet1 = pd.merge(sheet1,sheet2,left_on='学号',right_on='学号') #连接两个表
sheet1 = sheet1.drop(columns = ['手机号'])
sheet1
或者在第一步读取文件的时候改成sheet2 = pd.read_excel("E:\python_data.xlsx",sheet_name="信息表",usecols=[0,1])
,这样就可以不用drop手机号了