基于上一篇博客,已经得到各文本的数据,现在开始对这些数据进行处理:搜索文本
1、利用concordance函数来查找文本中的词:如monstrous、affection、lived
2、利用similar函数查找相似文本
3、common_contexts函数研究共用两个或两个以上词汇的上下文
4、利用dispersion_plot函数绘制离散图
计数词汇:
使用len函数获取长度,使用set获取唯一词汇,sorted函数得到一个排序表(大写字母出现在小写字母之前)
接下来,统计特定的词:
计数一个单词在文本中出现的次数,计算一个特定词在文本中占据的百分比
使用函数对几个文本重复计算,调用即可