Python自然语言处理 nltk.text模块下Text对象的各个函数（入门函数）用法分享

1419436753

于 2020-03-20 20:27:02 发布

阅读量3.4k

点赞数 8

文章标签：数据挖掘机器学习 python 深度学习自然语言处理

本文链接：https://blog.csdn.net/u010985535/article/details/104997340

版权

本文详细介绍了Python自然语言处理库nltk.text模块中Text对象的各种函数，包括collocation_list、common_contexts、concordance等，用于处理文本中的搭配词、上下文、频率分布等。通过实例展示了每个函数的用法和效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

此文章是个人在学习nltk.text模块的过程中的一个总结，难免有瑕疵的地方，欢迎大家参与讨论，感谢你的善良。

1.collocation_list

####这一段为模板代码下面的函数就省略了
import nltk.corpus
from nltk.text import Text
mytext = Text(nltk.corpus.gutenberg.words('melville-moby_dick.txt'))
####这一段为模板代码 下面的代码就不再重复了

作用：返回从文本派生的搭配词（连在一起的词），忽略停用词。
用法： def collocation_list(self, num=20, window_size=2):
:param num: 返回的搭配词的最大数量
:type num: int
:param window_size: 搭配所跨越的令牌数 (default=2)
:type window_size: int
例子：