标题解释:
我并未涉及过任何大数据项目的开发,题目叫做大数据分析,是为了做seo。
如果我把标题写成数据统计,的确更贴合我这篇文章的意思
那大概这篇文章就石沉大海了。
我对大数据的理解只有很浅薄的一层,但是对于做这个小程序大概是足够了。
总体大的思路是每个题型都是一个独立的百分比,统计其中的选项最后分析出可能性最大的那个选项。
澄清:
这里的数据量很少,大数据肯定要以T为单位的分析。
这里的分析结果只能参考,实质作用会很小。
小到不如利用这些时间更努力的去复习。
所以我并不提倡用这种方法做题。
我只是觉得这里的思路很有意思,而且我可以实现,我觉得有意思的事情都会去立刻去实现。
程序思路:
##统计内容
##1.数学选择题 30道
##2.英语选择题 40道
##3.完形填空 20道
##4.阅读理解20道
##统计06-19年真题卷子中选项百分比 通过大数据的方式做选择题
##统计数据总数
##1.数学选择题 14*30道=420道
##2.英语选择题 14*40道=560
##3.完形填空 14*20道=280
##4.阅读理解14*20道=280
任务量最大的就是统计这些选项了,我有想过用ocr识别,ocr识别还是需要一张一张拍真题卷,而且当中可能会有识别错误。
罢了。
设计目的:
考试中总会出现不会写的题目,做一些选择题的时候 比起来选择 "看起来很像答案的选项" 倒不如使用数据分析后的答案
我一直都认为 知识>数据分析>感觉。
预计分数:
英语:
数据推导:20分/60分
自己实力:20分/40分阅读理解+作文10-15分/20分+选择题5/20分
合计35分/90分
合计英语最低分数:55分/150分
平均英语分数应该为60分/150分
数学:
70-80分
共计最低总分=125分
共计平均总分=140分
目标分数150分 和我理想的还差25分 加油吧 还有44天
平均结果:
# 选择题
# ==========================
# A:143 B:151 C:138 D:128 合计:560
# A:25.5% B:27.0% C:24.6% D:22.9%
# ==========================
# 推荐选项百分比: 26.96428571428571 B
# 完形填空
# ==========================
# A:69 B:73 C:74 D:64 合计:280
# A:24.6% B:26.1% C:26.4% D:22.9%
# ==========================
# 推荐选项百分比: 26.42857142857143
# 阅读理解
# ==========================
# A:62 B:65 C:78 D:75 合计:280
# A:22.1% B:23.2% C:27.9% D:26.8%
# ==========================
# 推荐选项百分比: 27.857142857142858
# 改错
# ==========================
# A:17 B:26 C:28 D:19 合计:90
# A:18.9% B:28.9% C:31.1% D:21.1%
# ==========================
利用平均统计后的结果模拟做题
太蠢了,用平均值的方法做题,满分100分的题目最高是34分 放弃,使用另外一种思路
思路2:
06年第一题-07年第一题-08年第一题...2019年第一题 然后计算出概率最高的
06年第二题-07年第而题-08年第二题...2019年第二题 然后计算出概率最高的
...
06年第二十题-07年第二十题-08年第二十题...2019年第二题 然后计算出概率最高的
测试内容:
1.选择题前20题
2.完形填空20题
结论:
前20选择题 使用结论 模拟考试
年份:2006正确数10
年份:2007正确数7
年份:2008正确数7
年份:2009正确数6
年份:2010正确数7
年份:2011正确数13
年份:2012正确数7
年份:2013正确数5
年份:2014正确数7
年份:2015正确数11
年份:2016正确数8
年份:2017正确数11
年份:2018正确数12
年份:2019正确数5
得分区间:5~13
平均得分:8.2
完形填空 使用结论 模拟考试
年份:2006正确数8
年份:2007正确数6
年份:2008正确数6
年份:2009正确数8
年份:2010正确数7
年份:2011正确数10
年份:2012正确数5
年份:2013正确数6
年份:2014正确数8
年份:2015正确数9
年份:2016正确数8
年份:2017正确数11
年份:2018正确数9
年份:2019正确数8
得分区间:14-22
平均得分:14.8
总结:
前20选择题均为语法考察 后20道题为词组+固定搭配 可通过背诵掌握
前20选择题结论:避免有同学误入歧途影响考试 结论已经抹除
完形填空20题结论:避免有同学误入歧途影响考试 结论已经抹除
得分总结:
最低得分:19/60
平均得分:22/60
最高得分:35/60
缺点是需要背诵以上40个选项,如果不想背以上40个选择 可以记住以下结论
通过平均值计算出最高概率的选项:
避免有同学