使用Python统计历年来各种英语高考题中单词的出现频数

说明

笔者个人博客网站:https://hk-shao.github.io/
最新文章和更新都会在这里

我从网上搜集了历年来高考英语新课标卷真题,还有各个省的高考真题,以及各种模拟题,题型汇总总共20多个doc文件,然后使用正则匹配删除了除了英文单词外的所有字符(保留空格),使用Python写了一个很简单的程序,统计出了8千多个不同的单词及其频数,使用Excel进行排序。

演示的视频

闲着就录成视频发到B站:https://www.bilibili.com/video/av42936333/

19/2/10更新

我用Python写了一个简单的有道单词爬虫,实现了单词的汉语释义,以及过滤了许多不存在的单词。然后就开源到GitHub上了,地址如下:
https://github.com/HK-SHAO/English-Spider

Python源代码

import csv

f = open('english.txt') # 打开txt文件
word = f.read().split(' ') # 将单词转换成列表
f.close() # 关闭txt文件

# l = [] # 统计的列表

csv_file = open('data.csv', 'w', newline = '') # 打开csv文件
csv_write = csv.writer(csv_file) # 写csv文件

while len(word) is not 0: # 当列表未空
    w = word[0] # 单词
    n = 0 # 出现的次数

    while w in word: # 当word里还有单词w
        word.remove(w) # 删除已经统计的单词
        n = n + 1 # 次数加一

    if len(w) > 3: # 过滤长度小于4的单词
        csv_write.writerow([w, n]) # 写入csv文件
        # l.append([w, n])

csv_file.close() # 关闭csv文件

单词排序的CSV文件

前往我的博客下载。

英语单词频数表

这里只给出前500个频数最高的单词。

1475,that,pron.那;那个; adv.那么;那样; conj.因为;以至于; adj.那;那个; n.(That)人名;(德)塔特
892,with,prep.用;随着;支持;和…在一起; n.(With)人名;(德、芬、丹、瑞典)维特
775,they,pron.他们;它们;她们
670,have,vt.有;让;拿;从事;允许; aux.已经; n.(Have)人名;(芬)哈韦;(德)哈弗
645,from,prep.来自,从;由于;今后; n.(From)人名;(瑞典、丹、德)弗罗姆
591,their,pron.他们的,她们的;它们的; n.(Their)人名;(英)蒂尔;(芬、瑞典)泰尔
571,more,adv.更多;此外;更大程度地; adj.更多的;附加的; pron.更多的数量; n.更多; n.(More)人名;(英、法)莫尔;(意、西、以)莫雷
532,people,n.人;人类;民族;公民; vt.居住于;使住满人
513,what,pron.什么;多么;多少; adj.什么;多么;何等; adv.到什么程度,在哪一方面; int.什么;多么
461,this,pron.这;这个;这里; adj.这;本;这个;今; adv.这样地;这么; n.(This)人名;(法)蒂斯
456,when,conj.考虑到;既然;当…时;在…时;如果; adv.什么时候,何时;(用于时间的表达方式之后)在那时;其时;当时; pron.那时;什么时侯; n.时间,时候;日期;场合
444,about,prep.关于;大约; adj.在附近的;四处走动的;在起作用的; adv.大约;周围;到处; n.大致;粗枝大叶;不拘小节的人; n.(About)人名;(法)阿布
418,your,pron.你的,你们的
365,there,adv.在那里;在那边;在那点上; int.你瞧; n.那个地方
359,them,pron.他们;它们;她们; n.(Them)人名;(老)探
357,some,adj.一些;某个;大约;相当多的; pron.一些;若干;其中的一部分;(数量不确切时用)有些人; adv.非常;相当;稍微
355,were,v.是,在(are的过去式); n.(Were)人名;(英、肯)沃尔
355,than,conj.比(用于形容词、副词的比较级之后);除…外(用于other等之后);与其…(用于rather等之后);一…就(用于nosooner等之后); prep.比;超过; n.(Than)人名;(老、柬、德)坦;(缅)丹
342,will,n.意志;决心;情感;遗嘱;意图;心愿; vt.决心要;遗赠;用意志力使; vi.愿意;下决心; aux.将;愿意;必须
323,which,pron.哪/那一个;哪/那一些; adj.哪一个;哪一些
322,time,n.时间;时代;次数;节拍;倍数; vt.计时;测定…的时间;安排…的速度; adj.定时的;定期的;分期的; n.(Time)人名;(俄)季梅;(英)泰姆;(罗)蒂梅
310,would,aux.将,将要;愿意; v.will的过去式
293,children,n.孩子们(child的复数)
264,been,v.是,有(be的过去分词); n.(Been)人名;(挪)贝恩
258,many,pron.许多;许多人; adj.许多的; n.(Many)人名;(法)马尼
251,because,conj.因为
246,most,adv.最;非常,极其;最多;几乎; adj.大部分的,多数的;最多的; n.大部分,大多数; n.(Most)人名;(德、俄、法、芬、捷、英)莫斯特
238,school,n.学校;学院;学派;鱼群; vt.教育
236,after,adv.后来,以后; prep.在……之后; conj.在……之后; adj.以后的
227,students,n.(尤指大专院校的)学生(student的复数)
219,help,vt.帮助;促进;治疗;补救; n.帮助;补救办法;帮忙者;有益的东西; vi.帮助;有用;招待; n.(Help)人名;(芬)海尔普
214,first,adv.第一;首先;优先;宁愿; n.第一;开始;冠军; adj.第一的;基本的;最早的; num.第一; n.(First)人名;(英)弗斯特;(捷)菲尔斯特
214,other,adj.其他的,另外的; pron.另外一个
212,life,n.生活,生存;寿命
196,work,n.工作;[物]功;产品;操作;职业;行为;事业;工厂;著作;文学、音乐或艺术作品; vt.使工作;操作;经营;使缓慢前进; vi.工作;运作;起作用; n.(英、埃塞)沃克(人名)
195,make,vt.使得;进行;布置,准备,整理;制造;认为;获得;形成;安排;引起;构成; vi.开始;前进;增大;被制造; n.制造;构造;性情; n.(Make)人名;(塞、南非)马克
192,said,adj.上述的,该; v.说(say的过去式和过去分词); n.(Said)人名;(西、塞、哈萨克、乌兹、吉尔、塔吉、土库、阿塞、阿拉伯)赛义德
189,only,adv.只,仅仅;不料; adj.唯一的,仅有的;最合适的; conj.但是;不过;可是
184,should,aux.应该;就;可能;将要
183,years,n.[天]年;年龄;岁月;年代
182,year,n.年;年度;历年;年纪;一年的期间;某年级的学生
179,like,vt.喜欢;想;愿意; vi.喜欢;希望; prep.像;如同; adj.同样的;相似的; n.爱好;同样的人或物; adv.可能; conj.好像
179,could,aux.能够; v.能(can的过去式)
178,good,adj.好的;优良的;愉快的;虔诚的; n.好处;善行;慷慨的行为; adv.好; n.(Good)人名;(英)古德;(瑞典)戈德
176,world,n.世界;领域;世俗;全人类;物质生活
169,also,adv.也;而且;同样; conj.并且;另外; n.(Also)人名;(罗)阿尔索
160,even,adj.[数]偶数的;平坦的;相等的; adv.甚至;即使;还;实际上; vt.使平坦;使相等; vi.变平;变得可比较;成为相等; n.(Even)人名;(法)埃旺;(德)埃文;(英)埃文
159,just,adv.只是,仅仅;刚才,刚刚;正好,恰好;实在;刚要; adj.公正的,合理的;正直的,正义的;正确的;公平的;应得的; n.(Just)人名;(英)贾斯特;(法)朱斯特;(德、匈、波、捷、挪)尤斯特;(西)胡斯特
158,then,adv.然后;那么;于是;当时;此外; n.(Then)人名;(德)特恩
154,water,n.水;海水;雨水;海域,大片的水; vt.使湿;供以水;给…浇水; vi.加水;流泪;流口水; n.(Water)人名;(英)沃特
153,parents,n.父母;双亲(parent的复数); v.教养;引起(parent的三单形式); n.(Parents)人名;(法)帕朗
151,found,vt.创立,建立;创办; v.找到(find的过去分词)
150,into,prep.到…里;深入…之中;成为…状况;进入到…之内; n.(Into)人名;(芬、英)因托
148,much,adv.非常,很; adj.大量的; n.许多,大量; pron.许多,大量; n.(Much)人名;(德)穆赫;(英)马奇
147,author,n.作者;作家;创始人; vt.创作出版
145,passage,n.一段(文章);走廊;通路;通过; n.(Passage)人名;(英)帕西奇;(法)帕萨热
141,very,adj.恰好是,正是;甚至;十足的;特有的; adv.非常,很;完全; n.(Very)人名;(英)维里
141,know,vt.知道;认识;懂得; vi.了解;熟悉;确信
139,according,adj.相符的;一致的;相应的;和谐的;调和的; adv.依照;根据;按照; v.给予(accord的现在分词);使和谐一致;使符合;使适合
139,important,adj.重要的,重大的;有地位的;有权力的
138,paragraph,n.段落;短评;段落符号; vt.将…分段
137,down,adv.向下,下去;在下面; adj.向下的; n.软毛,绒毛;[地质]开阔的高地; prep.沿着,往下; vt.打倒,击败; vi.下降;下去; n.(Down)人名;(英)唐
136,while,conj.虽然;然而;当……的时候; n.一会儿;一段时间; vt.消磨;轻松地度过
135,well,adv.很好地;充分地;满意地;适当地; adj.良好的;健康的;适宜的; n.井;源泉; v.涌出; ; n.(Well)人名;(英、德、荷)韦尔
135,think,vt.想;认为;想起;想像;打算; vi.想;认为; n.想;想法; adj.思想的
135,want,vt.需要;希望;应该;缺少; n.需要;缺乏;贫困;必需品; vi.需要;缺少
135,family,n.家庭;亲属;家族;子女;[生]科;语族;[化]族; adj.家庭的;家族的;适合于全家的
133,often,adv.常常,时常
131,find,vt.查找,找到;发现;认为;感到;获得; vi.裁决; n.发现; n.(Find)人名;(丹)芬
130,over,adv.结束;越过;从头到尾; prep.越过;在…之上;遍于…之上; adj.结束的;上面的; vt
  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值