Python数据分析与可视化案例解析

题目需求描述

已知两个Excel表格:学生基本信息表期末考试成绩表分别用于存放学生的基本信息(包括姓名性别班级)和学生的期末成绩(包括姓名语文数学英语总分),部分数据如下图所示(完整数据见学生基本信息表.xls期末考试成绩表.xls),完成以下操作。

(1)编写程序读取两张表中的数据,并将其根据姓名进行合并,然后将合并后的数据按照总分从高到低进行排序,总分相同时,根据英语成绩从高到低排序,并将结果存放在学生期末考试成绩排名表.xls中,最终表中的部分数据如下。

 (2)编写程序分别用饼状图绘制出语文、数学、英语课程优秀分数>=90)、良好90>分数>=80)、中等80>分数>=70)、及格70>分数>=60)、不及格分数<60)的比例。最终效果如图所示,要求三个图放在一个大图中,大图的标题为学生各科成绩分布图,每个图都有子标题,例如语文成绩分布,所有比例保留1位小数点,最终的图保存为饼状图.png

 (3)编写程序分别用条形图绘制出语文、数学、英语课程的最低分、最高分以及平均分。最终效果图如图所示,要求图中显示图例标题,条形图上方显示相应数字,最终的图保存为条形.png

代码参考 

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np


def get_datas(df, col):
    level_1 = len(df[df[col] >= 90])
    level_2 = len(df[(df[col] < 90) & (df[col] >= 80)])
    level_3 = len(df[(df[col] < 80) & (df[col] >= 70)])
    level_4 = len(df[(df[col] < 70) & (df[col] >= 60)])
    level_5 = len(df[df[col] < 60])
    return level_1, level_2, level_3, level_4, level_5


# 第一小题
d_1 = pd.read_excel("学生基本信息表.xls", skiprows=1)
d_2 = pd.read_excel("期末考试成绩表.xls", skiprows=1)
d_3 = pd.merge(d_1, d_2)
d_3 = d_3.sort_values(by=["总分", "英语"], ascending=False)
d_3.to_excel("学生期末考试成绩排名表.xls")


# 第二小题
results = []
titles = ["语文", "数学", "英语"]
plt.rcParams["font.family"] = "FangSong"  # 设置字体
labels = ["优秀", "良好", "中等", "及格", "不及格"]
for title in titles:
    results.append(get_datas(d_3, title))

plt.figure(figsize=(12, 5))  # 创建一个新图
plt.suptitle("学生各科成绩分布图")
for index, data in enumerate(results):
    print(data)
    plt.subplot(1, 3, index + 1)
    plt.title(titles[index] + "成绩分布")
    plt.pie(data, labels=labels, autopct='%.1f%%', shadow=True, labeldistance=1.2,
            explode=(0.1, 0, 0, 0, 0), colors=['m', 'c', 'y', 'r', 'g'])
plt.savefig("饼状图")


# 第三小题
plt.figure()  # 创建一个新图
min_datas =[np.min(d_3["语文"]), np.min(d_3["数学"]), np.min(d_3["英语"])]
mean_datas =[np.mean(d_3["语文"]), np.mean(d_3["数学"]), np.mean(d_3["英语"])]
max_datas =[np.max(d_3["语文"]), np.max(d_3["数学"]), np.max(d_3["英语"])]
kemu_datas = [min_datas, mean_datas, max_datas]
legends = ["最低分", "平均分", "最高分"]
x = range(len(titles))
plt.title("各科成绩统计信息")
for index, data in enumerate(kemu_datas):
    plt.bar([i + 0.3 * index for i in x], height=data, width=0.3, label=legends[index])
    for j, num in enumerate(data):
        plt.text(0.3 * index + j, num + 1, "{:.1f}".format(num), ha="center", va="bottom", color="r")
plt.xticks([i + 0.3 for i in x], titles)  # 绘制底部标签
plt.legend()
plt.savefig("条形图")
plt.show()

相关资源和代码可以关注微信公众号:Python资源分享,回复 0603 即可获取。或者通过CSDN资源下载页下载:https://download.csdn.net/download/Dream_Gao1989/19358882

  • 50
    点赞
  • 705
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

高成珍

前行路上与你相伴!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值