python考研真题_用Python分析了1980~2015年考研英语真题词汇,原来考研英语应该这样考!...

微信改版,加星标不迷路!

0a2d3046-5759-4087-8cd1-9a813b1f5313.gif

用Python分析了1980~2015年考研英语真题词汇,原来考研应该这样考!

作者:阿广

概述

前言

数据介绍

实现过程

考研英语词汇统计分析

搞笑一刻

阿广说

每日问题

推荐阅读

前言

我们渐渐长大,从一开始的初生牛犊不怕虎到渐渐惧怕孤独,从一开始的单打独斗到渐渐合群躲避孤独。不巧的是,考研就是一个孤单修炼的事情,没有任何人能够去帮你,于是二十出头的我们,从“牛b吊炸天,我要改变全世界”逐渐蜕变成“我要适应这个世界,我要适应孤单”。过去总是赶赴一场又一场热闹,在觥筹交错间,推杯换盏时,说一些违心的话,做一些违心的事,慢慢失去自我。但愿,酒阑人散后,剩下的只有空虚落寞;但愿,灯火阑珊处,留下是考研最美好的回忆。

数据介绍

本文统计的对象为1980年以来英语试卷所包含的词汇,并对其进行了分析和总结。

5868ac0f-5c8f-4a6c-9de4-ee48daf2c238.png

实现过程

(1)加载基础词汇

bw = open('data/basic_words.txt')

basicwords = []

for eachLine in bw:

basicwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

#print re.split("[^A-Za-z]", eachLine)[0]

print(len(list(set(basicwords))))

basicwords = list(set(basicwords))

(2)加载超纲词汇

notindagang = np.zeros(33)

chaogangword = {}

for j in range(33):

for k in wy.eywords[j]:

if k not in dw.dagangwords and k not in bw.basicwords:

#notindagang[j] += 1

if chaogangword.has_key(k):

chaogangword[k] += 1

else:

chaogangword[k] = 1

for j in range(33):

for k in wy.eywords[j]:

if k not in dw.dagangwords and k not in bw.basicwords:

if chaogangword[k] <= 2:

notindagang[j] += 1

chaogangword = sorted(chaogangword.iteritems(), key = lambda e:e[1], reverse = True)

print('Chaogangword =',chaogangword)

pnotindagang = [float(x) / len(wy.eywords[i]) for i,x in enumerate(notindagang)]

(3)词汇分析

def simplify_word(a):

#如果已经可以判断是名词,动词,形容词,副词,连词

if enumerate.is_noun(a) or enumerate.is_verb(a) or enumerate.is_adjective(a) or enumerate.is_adverb(a) or enumerate.is_connective(a):

return a

try:#测试是否为动词,如果是则返回

enumerate.is_verb(enumerate.verb.present(a))

return enumerate.verb.present(a)

except:#否则继续检查

pass

#测试是否是名词

if enumerate.is_noun(enumerate.noun.singular(a)):

return enumerate.noun.singular(a)

otherwordlist.append(a)

#print a

return a

(4)加载大纲词汇

dagang = open('data/5495大纲词汇.txt')

dagangwords = []

for eachLine in dagang:

dagangwords.append(sw.simplify_word(re.split("[^A-Za-z]", eachLine)[0].lower()))

#print re.split("[^A-Za-z]", eachLine)[0]

print(len(list(set(dagangwords))))

dagangwords = list(set(dagangwords))

(5)考研英语真题单词数据可视化

x33 = 1980*np.ones(33)+range(33)

x32 = 1981*np.ones(32)+range(32)

plt.figure('wordeachyear')

plt.plot(x33,wy.eywords_volume,'r--o',alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('notindagang')

plt.plot(x33,cgw.notindagang,'o-', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('wn')

plt.plot(wy.eywords_volume,cgw.pnotindagang,'bo')

plt.show()

plt.figure('pchaogang')

plt.plot(x33,cgw.pnotindagang,'o-', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('notinpast')

plt.bar(x33,nip.words_not_in_the_past, color = 'green', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('wordsAppearLastTime')

plt.plot(x32, walt.es, 'b--o', alpha = 0.5)

plt.grid(True)

plt.show()

plt.figure('pwordsAppearLastTime')

#plt.axes([1980, 2013 , 0.35 ,0.6])

plt.plot(x32, walt.esr1, 'r-o')

plt.plot(x32, walt.esr2, 'b--o', alpha = 0.4)

plt.plot(x32, walt.esr3, 'y--o', alpha = 0.4)

plt.grid(True)

plt.show()

https://github.com/zandaoguang/English

或者点击查看原文即可获得源码

考研英语真题词汇统计结果

1.第i+1年出现的从1980~i年间从未出现过的单词

a3834a8a-104d-40b1-8350-b5b5c3f1ef0f.jpg

2.第一年真题中出现的单词数

107ac808-94de-4444-a19b-888502c01ab4.jpg

3.每一年都出现的单词

and, have, other, most, last, all, year, way, hi, like, because, your, new, know, english, chinese, if, you, they, this, give, people, he, not, many, question, from, into, such, work, over, would, make, translation, up, in, no, then, an, will, some, section, we, with, these, it, there, which, by, so, one, when, do, those, can, four, be, that, must, of, say, should, than, a, become, at, write, who, on, the, only, to, but, about, or, for

4.相邻年份考研真题词汇重复数

17b16c59-f436-4151-8488-9a9e11183ff4.jpg

5.相邻年份考研真题词汇重复率

97cc5e09-c846-4189-bfd9-361b3d48f5ee.jpg

6.计算35年来真题词汇超纲率

38eea284-09a6-4a1f-ad59-de4169cba029.jpg

7.拟合

1a00f43c-ba0e-4b60-96d8-8769be36fb18.jpg

搞笑一刻

3971f250-7fff-44e5-93e2-d83357a16e63.png

30df8ca9-c07d-4759-9de1-79b63252a8c5.png

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

我问了我考研同学的成绩了,只说了一句:“来,再开一局”……

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

用四个字形容考完研后的自己:“重在参与”

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

我已经用了四年的时间证明了自己不是读书的这块料,但学校没有放弃我,给了我最后三天,让我证明了我自己,确实不是读书这块料。

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

今天去考研自习室,发现一美女坐我座位上,心中颇为惊喜,激动的走过去问“请问美女你有男朋友了吗?”美女忽然脸红:“没有”。“没有男朋友还敢抢我座位, 一边去!”

627e2efe-47e0-4cf0-aa30-0fb967167bd4.jpg

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

考研的叫普遍性,不考的那叫特殊性。答题纸写满那叫具体性,啥都不会那叫历史性,机读卡填错了那叫抽象性。考上了那叫前进性,没考上那叫曲折性,报了名去考那叫必然性,睡过了没去考那叫偶然性——所以考研是普遍性特殊性具体性历史性抽象性前进性曲折性必然性偶然性高度统一的结果。

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

发下卷子正心凉,一紧张,词全忘,似曾相识,何意却不详。完型排序两茫茫,看阅读,泪千行。步出考场见同窗,都一样,很受伤,如此成绩无颜见爹娘。只待明朝发榜日,结绳套,系房梁,从此阴阳两相望。空惆怅,叹悲凉,来生再做考研状元郎。

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

考研就像参加超级女生,能坚持到最后的都是纯爷们!

947686cc-2b1c-40af-8d9b-09bc1d8277cb.gif

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

考研英语,单词几乎是研考生心里永远的痛,今年又考倒了一大片,何必总是拿外国话来为难自己的同胞呢?

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

考研的都是勇士,考上去的是上士,考下去的是下士,还站着的是战士,考躺下的是烈士!

8daf5880-9942-41c7-8ec3-35f5da9271f4.gif

我爸说过的最让我感动的一句话:孩子好好加油吧!以前我打麻将都是玩10块的,现在为了供你考研,我都只玩1块的了……

b4b2db16-5ef4-4550-85d7-84676ede09fc.gif

注:以上均为段子,希望每一位考研人本周六周日过过过!

阿广说

时光如白驹过隙,世事如白云苍狗。转眼间,我们也迎来了继高考以来第二次决定命运的战斗-考研。“考研是孤独的,孤独两个字拆开,有孩童,有瓜果,有小犬,有蚊蝇,足以撑起一个那年盛夏傍晚的巷子口,人情味十足。稚儿擎瓜柳蓬下,细犬逐蝶深巷中。人间繁华多笑语,唯我空余两鬓清风。孩童、水果、猫、狗、飞蝇当然热闹,可都与你无关,这就叫孤独,这就叫考研。”

6ac522bf-8d3d-43fc-b2c9-62649513c99a.gif

推荐阅读

94933b75-6f27-4aab-ade1-9ea1c16379e5.png

85892435-b397-44d3-9c2b-785da7ed289b.png

今日问题

85892435-b397-44d3-9c2b-785da7ed289b.png

在计算机领域,你认为考研有必要吗?

打卡格式:打卡第n天,答:...

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值