考研政治试题大数据分析

考研政治试题大数据分析

项目开源链接:github

一、思路来源

某考研培训机构一次考研线下讲座,讲师在讲解政治试题时,提到了一种思路:通过分析历年考研政治试题,可以发现一些选项规律,从而可以更好地备考。这种思路给我留下了深刻印象

具体方法(机构某老师提出的)

  1. 选项中出现XXX,这个选项即正确,选项中出现YYY,这个选项即错误【已完成】
  2. 在多选题中,题干中出现XXX全选(好像要分具体的下级学科,如马原、习思等 数据库中预留了该字段)

二、数据来源

某小程序抓包,获取了历年考研政治试题,包括真题、模拟题、专项题等,数据量大,但是数据质量参差不齐,需要进行完善,提供json格式数据(在data文件中),提供mysql文件

三、文件说明

  1. data文件夹:存放数据
  2. count.py:统计词频,即思路来源中第二个方法
  3. duoxuan_all.py:统计多选题中,题干中出现XXX全选的情况
  4. main.py:主程序,数据处理
  5. data/XX.json:数据文件,20XX年考研政治真题
  6. data/count.csv:词频统计结果
  7. data/XXX_cut_list.txt:分词结果

四、复现操作

  1. 下载本项目
  2. 运行main.py
  3. 运行count.py
  4. 打开data/count.csv查看结果

五、分析结果(18-24年)

选项中出现该词正确

在这里插入图片描述

选项中出现该词错误

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wooovi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值