最近在学《python自然语言处理》这本书,写博客就当做笔记
1.concordance函数
关键词语索引,显示某个词的出现情况和上下文
text1.concordance("monstrous")
2.similar函数
查询括号中相关词在上下文相似的词语
text1.similar("monstrous")
3.common_contexts函数
研究共用两个或者两个以上词汇的上下文
text2.common_contexts([monstrous,very])
4.generate函数
产生一些随机文本
text3.generate()
5.len函数
标识符是表示一组字符序列,len()计算的是这些序列出现的次数,而不是不同的单词的个数。
可通过set(text3)获取text3的词汇表,再len(set(text3))来获取词汇表的个数。
count()函数用来获得某个单词在文本中出现的次数