版权声明:本文为博主原创文章,博客地址:https://blog.csdn.net/m0_37615390,未经博主允许不得转载。
阅读文本大概需要 4.6 分钟。
今天是教师节,先祝天下所有老师教师节快乐,感谢您在我学生时代对我的谆谆教诲。
现在是开学之初,风华正茂的青年才俊们应该已经在图书馆占好了座位,开始备战 12 月份的英语四六级考试了吧!想当年,pk 哥四级考试前也在图书馆待了一阵子,后来四级考了 450 分惊险过关,六级考试第一次考了 400 分没过,第二次准备去考时找不到准考证,考完第二天才发现夹在了纸质的笔记本里,大写的尷尬啊,后来也就不了了之。我们知道,四六级考试中,单词的词汇量是重点,阅读时如果单词都不认识的话,影响我们对语句的理解,这样也会降低答题的正确率。
怎么去高效的记单词也是一件头疼的事情,可能今天记住了,明天又忘了。
今天我用 Python 分析了最近 10 年的四六级考试的真题,把里面的单词进行统计,按照降序排序,并做成可视化的图形。
项目环境
语言:Python 3
编辑器:Pycharm
我从网上下载了最近 10 年的四六级考试的真题,都为纯文本 txt 格式的文件。我先把四六级真题单独建了文件夹保存。
合并文本
以四级真题为例,为了便于统计,我先把近 10 年所有的纯文本真题合并成一个纯文本文件。遍历读取给定路径下的所有文件的内容,保存到新文本中。
单词统计
全部原文 请点击这里查看