本文会为大家介绍一款语料库检索工具—AntConc,并以《老爸老妈浪漫史》为例,简单介绍了词频分析的步骤(具体操作教程可见文末)!
通过这款工具,我们可以为各类英文文档做分析对比,并精准定位文档中的特定词汇。在英语学习的过程中,能够帮助我们分析美剧电影或者英文原版小说等文档,从而根据用词的难易程度,对文本的难度有一个具体的判断,并挑选出最适合自己的学习资料。
先简单了解一下AntConc:
先奉上下载地址:
http://www.laurenceanthony.net/software/antconc/,也可以通过我在文末分享的资源进行安装。
AntConc是免费的语料库检索工具,适用于语料库语言学、翻译学、外语教学等领域。AntConc具有Concordance,Concordance Plot,File View,Collocates,Word List,Keyword List(索引,索引定位,文件查看,搭配,词单,关键词)等功能!作用十分强大!
并且每次分析得到的文档可以直接保存到电脑上,具体方法可参考附带的教程。

实例分析:
我将《老爸老妈浪漫史》全九季的内容(用的是txt文档)放入检索工具AntConc中,可以发现整个老爸老妈浪漫史用到的单词有629515个。

排除一些重复的单词,最后剩下的单词有19000多个。

《老爸老妈浪漫史》竟然有19000个单词,说明《老爸老妈浪漫史》算得上是比较难的一部剧,英语水平一般的同学,完全看懂该剧的可能性很低。
这部剧中出现最频繁的单词是i,you,the这类词,出现次数高达27228次,而这类单词都是口语中最为常用,最核心的单词。

来看一看出现次数排行第9的that(截图只是部分例句),点击上图中的that,就会出现that所在的剧本中位置,从而能轻松了解到that的具体用法。

再来看看部分低频单词:

不知道大家看完这部剧之后,对这些低频单词是否还有印象?这些单词难度着实很高。
Zihautanejo出现在第二季,从语境中可以猜测是个地名:[墨西哥] 锡瓦塔内霍

ziti出现在第五季,释义是:意大利通心面

此外,我们还可以看到单词的搭配,比如:look,按照搭配的频率排列,与look搭配最频繁的一个单词是you。

排行第三的是to,我们也可以看看look的右边,可见look可以与look at,look like,look for,look away等搭配。

当然,我们也可以直接看到look右边的一些搭配:

点击图片中的look if,就会出现具体的句子:

我随即又检测了下a...of在剧中的搭配以及出现的次数一共出现了1186次

部分a...of的搭配如下: a list of,a bunch of,a couple of,a kind of等等

那么到底该如何利用AntConc做词频分析呢?我已经为大家整理了一份非常详细的使用教程!
我的公众号:英语口语库
回复后台:AC,即可领取AntConc安装包以及使用教程