基于大数据的高校英语现状分析

温馨提示:文末有 CSDN 平台官方提供的学长 QQ 名片 :) 

1. 项目简介

        全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。

2. 四六级成绩数据读取

df_202009_six = pd.read_excel('./data/2020年9月大学英语六级成绩.xls')
df_202009_four = pd.read_excel('./data/2020年9月大学英语四级成绩.xls')
df_202012_six = pd.read_excel('./data/2020年12月份六级成绩.xls')
df_202012_four = pd.read_excel('./data/2020年12月份四级成绩.xls')
df_202106_six = pd.read_excel('./data/2021年6月份英语六级成绩数据.xls')
df_202106_four = pd.read_excel('./data/2021年6月份英语四级成绩数据.xls')

3. 数据可视化探索分析

3.1 不同学院报考的学生数量分布

plt.figure(figsize=(16, 5))
plt.subplot(121)
ax = sns.countplot(df_202009_six['学院'], order=sorted(list(set(df_202009_six['学院']))))
ax.set_xticklabels(ax.get_xticklabels(),rotation=90) 
plt.title('2020年9月各学院大学英语六级报考人数', fontsize=16, weight='bold')

plt.subplot(122)
ax = sns.countplot(df_202009_four['学院'], order=sorted(list(set(df_202009_four['学院']))))
ax.set_xticklabels(ax.get_xticklabels(),rotation=90) 
plt.title('2020年9月各学院大学英语四级报考人数', fontsize=16, weight='bold')
plt.show()

 

3.2 各学院六级得分变化与分布情况

3.3 各学院四级得分变化与分布情况

3.4 各学院四六级考试弃考率变化情况

3.5 各学院四六级得分分布箱型图

xueyuan_6_dict = {k: 0 for k in set(df_202106_six['学院'])}

for xueyuan in xueyuan_6_dict:
    xueyuan_df = df_202106_six[df_202106_six['学院'] == xueyuan]
    if xueyuan_df.shape[0] == 0:
        continue
    defen = xueyuan_df['总分'].values
    defen = defen[defen > 0]
    xueyuan_6_dict[xueyuan] = defen.tolist()
plt.figure(figsize=(16, 10))
plt.boxplot(xueyuan_6_dict.values(), labels = xueyuan_6_dict.keys())
plt.title('各学院六级得分分布箱型图', fontdict={'weight':'normal','size': 20})
pl.xticks(rotation=90)
plt.show()

3.6 各科目得分与总分之间的回归分析

3.7 各学院四六级及格率统计分析

xueyuan_4_dict = {k: 0 for k in set(df_202106_four['学院'])}

for xueyuan in xueyuan_4_dict:
    xueyuan_df = df_202106_four[df_202106_four['学院'] == xueyuan]
    if xueyuan_df.shape[0] == 0:
        continue
        
    pass_df = xueyuan_df[xueyuan_df['总分'] >=425]
    pass_ = pass_df.shape[0]
    pass_ratio = pass_ * 1.0 / xueyuan_df.shape[0]
    
    xueyuan_4_dict[xueyuan] = pass_ratio
    
    print(f'{xueyuan}:{pass_ratio}')

xueyuan_4_dict = sorted(xueyuan_4_dict.items(), key=lambda x: x[1], reverse=True) 

plt.figure(figsize=(16, 6))
plt.bar([x[0] for x in xueyuan_4_dict], [x[1] for x in xueyuan_4_dict])
pl.xticks(rotation=90, fontsize=14)
plt.title('各学院四级通过率分布柱状图', fontdict={'weight':'normal','size': 20})
plt.show()

 

4. 总结

        全球化时代,英语的重要性日益凸显。现如今我国高校英语教育还存在教学形式单一、没有创新、传统模式已经不适合当今社会发展等弊端,需要制订出符合国情的教学规划,采取相对应的策略,增进教育理念,培养高素质人才。本项目利用 pandas + Matplotlib + seaborn + sklearn 等工具包对某高校各大学院学生历年的四六级数据进行多维度的统计分析,展现高校英语的现状,为英语教学改革提供精细化的分析。

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。技术交流、源码获取认准下方 CSDN 官方提供的学长 QQ 名片 :)

 精彩专栏推荐订阅:

1. Python 毕设精品实战案例
2. 自然语言处理 NLP 精品实战案例
3. 计算机视觉 CV 精品实战案例

  • 4
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
随着旅游业的发展和大数据技术的广泛应用,基于大数据技术的旅游管理系统得到了越来越多的研究和应用。本文将从国内研究现状的角度,对基于大数据技术的旅游管理系统进行简要介绍。 首先,在旅游业中应用大数据技术的研究已经取得了一定的成果。例如,使用大数据技术对旅游市场进行分析和预测,可以帮助旅游从业者更好地制定营销策略和旅游产品。另外,基于大数据的旅游交通管理系统,可以通过实时监测交通状况,提供交通建议和路线规划,提高旅游者的出行效率和体验。还有基于大数据的旅游景区管理系统,通过实时监测游客数量和活动轨迹,可以更好地管理景区,提高游客的旅游体验和安全性。 其次,国内一些研究机构和企业也在基于大数据技术的旅游管理系统方面进行了一些尝试。例如,国内某旅游科技企业研发了基于大数据的旅游智能管家系统,可以通过数据分析和智能推荐,为旅游者提供个性化的旅游行程和服务。另外,国内某高校的研究人员也开发了基于大数据技术的旅游行为分析系统,可以对旅游者的行为和态度进行分析,为旅游从业者提供更好的数据支持。 最后,虽然基于大数据技术的旅游管理系统在国内得到了一些研究和应用,但仍存在一些问题和挑战。例如,如何保护旅游者的个人隐私和数据安全,如何实现数据共享和整合等问题仍需要进一步研究和解决。 总之,基于大数据技术的旅游管理系统在国内得到了越来越多的关注和应用,在未来的发展中,将会成为旅游业发展的重要推动力量。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Python极客之家

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值