python考研真题_用Python分析了1980~2015年考研英语真题词汇,原来考研英语应该这样考!...

微信改版,加星标不迷路!

用Python分析了1980~2015年考研英语真题词汇,原来考研应该这样考!

作者:阿广

出处:视学算法

概述前言

数据介绍

实现过程

考研英语词汇统计分析

搞笑一刻

阿广说

每日问题

推荐阅读

前言

我们渐渐长大,从一开始的初生牛犊不怕虎到渐渐惧怕孤独,从一开始的单打独斗到渐渐合群躲避孤独。不巧的是,考研就是一个孤单修炼的事情,没有任何人能够去帮你,于是二十出头的我们,从“牛b吊炸天,我要改变全世界”逐渐蜕变成“我要适应这个世界,我要适应孤单”。过去总是赶赴一场又一场热闹,在觥筹交错间,推杯换盏时,说一些违心的话,做一些违心的事,慢慢失去自我。但愿,酒阑人散后,剩下的只有空虚落寞;但愿,灯火阑珊处,留下是考研最美好的回忆。

数据介绍

本文统计的对象为1980年以来英语试卷所包含的词汇,并对其进行了分析和总结。

实现过程

(1)加载基础词汇bw = open('data/basic_words.txt')

basicwords = []

for eachLine in bw:

basicwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

#print re.split("[^A-Za-z]", eachLine)[0]

print(len(list(set(basicwords))))

basicwords = list(set(basicwords))

(2)加载超纲词汇notindagang = np.zeros(33)

chaogangword = {}

for j in range(33):

for k in wy.eywords[j]:

if k not in dw.dagangwords and k not in bw.basicwords:

#notindagang[j] += 1

if chaogangword.has_key(k):

chaogangword[k] += 1

else:

chaogangword[k] = 1

for j in range(33):

for k in wy.eywords[j]:

if k not in dw.dagangwords and k not in bw.basicwords:

if chaogangword[k] <= 2:

notindagang[j] += 1

chaogangword = sorted(chaogangword.iteritems(), key = lambda e:e[1], reverse = True)

print('Chaogangword =',chaogangword)

pnotindagang = [float(x) / len(wy.eywords[i]) for i,x in enumerate(notindagang)]

(3)词汇分析def simplify_word(a):

#如果已经可以判断是名词,动词,形容词,副词,连词

if enumerate.is_noun(a) or enumerate.is_verb(a) or enumerate.is_adjective(a) or enumerate.is_adverb(a) or enumerate.is_connective(a):

return a

try:#测试是否为动词,如果是则返回

enumerate.is_verb(enumerate.verb.present(a))

return enumerate.verb.present(a)

except:#否则继续检查

pass

#测试是否是名词

if enumerate.is_noun(enumerate.noun.singular(a)):

return enumerate.noun.singular(a)

otherwordlist.append(a)

#print a

return a

(4)加载大纲词汇dagang = open('data/5495大纲词汇.txt')

dagangwords = []

for eachLine in dagang:

dagangwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

#print re.split("[^A-Za-z]", eachLine)[0]

print(len(list(set(dagangwords))))

dagangwords = list(set(dagangwords))

(5)考研英语真题单词数据可视化x33 = 1980*np.ones(33)+range(33)

x32 = 1981*np.ones(32)+range(32)

plt.figure('wordeachyear')

plt.plot(x33,wy.eywords_volume,'r--o',alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('notindagang')

plt.plot(x33,cgw.notindagang,'o-', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('wn')

plt.plot(wy.eywords_volume,cgw.pnotindagang,'bo')

plt.show()

plt.figure('pchaogang')

plt.plot(x33,cgw.pnotindagang,'o-', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('notinpast')

plt.bar(x33,nip.words_not_in_the_past, color = 'green', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('wordsAppearLastTime')

plt.plot(x32, walt.es, 'b--o', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('pwordsAppearLastTime')

#plt.axes([1980, 2013 , 0.35 ,0.6])

plt.plot(x32, walt.esr1, 'r-o')

plt.plot(x32, walt.esr2, 'b--o', alpha = 0.4)

plt.plot(x32, walt.esr3, 'y--o', alpha = 0.4)

plt.grid(True)

plt.show()

https://github.com/zandaoguang/English

或者点击查看原文即可获得源码

考研英语真题词汇统计结果

1.第i+1年出现的从1980~i年间从未出现过的单词

2.第一年真题中出现的单词数

3.每一年都出现的单词

and,have,other,most,last, all,year,way,hi,like, because,your,new,know,english, chinese,if,you,they,this, give,people,he, not,many, question,from,into,such,work, over,would,make,translation,up, in,no,then,an,will, some,section,we,with, these, it,there,which,by,so, one,when,do,those,can, four,be,that,must,of, say,should,than,a,become, at,write,who,on, the, only,to,but,about,or, for

4.相邻年份考研真题词汇重复数

5.相邻年份考研真题词汇重复率

6.计算35年来真题词汇超纲率

7.拟合

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
相关推荐
程序员的必经之路! 【限时优惠】 现在下单,还享四重好礼: 1、教学课件免费下载 2、课程案例代码免费下载 3、专属VIP学员群免费答疑 4、下单还送800元编程大礼包 【超实用课程内容】  根据《2019-2020中国开发者调查报告》显示,超83%的开发者都在使用MySQL数据库。使用量大同时,掌握MySQL早已是运维、DBA的必备技能,甚至部分IT开发岗位也要求对数据库使用和原理有深入的了解和掌握。 学习编程,你可能会犹豫选择 C++ 还是 Java;入门数据科学,你可能会纠结于选择 Python 还是 R;但无论如何, MySQL 都是 IT 从业人员不可或缺的技能!   套餐中一共包含2门MySQL数据库必学的核心课程(共98课时)   课程1:《MySQL数据库从入门到实战应用》   课程2:《高性能MySQL实战课》   【哪些人适合学习这门课程?】  1)平时只接触了语言基础,并未学习任何数据库知识的人;  2)对MySQL掌握程度薄弱的人,课程可以让你更好发挥MySQL最佳性能; 3)想修炼更好的MySQL内功,工作中遇到高并发场景可以游刃有余; 4)被面试官打破沙锅问到底的问题问到怀疑人生的应聘者。 【课程主要讲哪些内容?】 课程一:《MySQL数据库从入门到实战应用》 主要从基础篇,SQL语言篇、MySQL进阶篇三个角度展开讲解,帮助大家更加高效的管理MySQL数据库。 课程二:《高性能MySQL实战课》主要从高可用篇、MySQL8.0新特性篇,性能优化篇,面试篇四个角度展开讲解,帮助大家发挥MySQL的最佳性能的优化方法,掌握如何处理海量业务数据和高并发请求 【你能收获到什么?】  1.基础再提高,针对MySQL核心知识点学透,用对; 2.能力再提高,日常工作中的代码换新貌,不怕问题; 3.面试再加分,巴不得面试官打破沙锅问到底,竞争力MAX。 【课程如何观看?】  1、登录CSDN学院 APP 在我的课程中进行学习; 2、移动端:CSDN 学院APP(注意不是CSDN APP哦)  本课程为录播课,课程永久有效观看时长 【资料开放】 课件、课程案例代码完全开放给你,你可以根据所学知识,自行修改、优化。  下载方式:电脑登录课程观看页面,点击右侧课件,可进行课程资料的打包下载。
©️2020 CSDN 皮肤主题: 深蓝海洋 设计师:CSDN官方博客 返回首页