![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 57
小儿小儿朗
这个作者很懒,什么都没留下…
展开
-
python之获得文本语料和词汇资源(3)
一级目录二级目录三级目录2.2条件频率分布条件频率分布是频率分布的集合,每个频率分布有一个不同的条件。这个条件通常是文本的类别。当预料分为几类时,可以计算每个类别独立的领率分布。就可以研究类别之间的系统性差异。2.2.1按照文本计数词汇import nltkfrom nltk.corpus import browncfd = nltk.ConditionalFreqDist( (genre,word) for genre in brown.categories() f原创 2021-03-23 15:09:36 · 387 阅读 · 2 评论 -
python之获得文本语料和词汇资源(2)
2.1 获取文本语料库2.1.1古腾堡语料库import nltkprint(nltk.corpus.gutenberg.fileids())#简·奥斯丁的《艾玛》–emma,找出它包含多少词emma = nltk.corpus.gutenberg.words('austen-emma.txt')print(len(emma))#‘austen-emma.txt’ 该文本中surprize的上下文emma = nltk.Text(nltk.corpus.gutenberg.words('原创 2021-03-21 22:42:40 · 422 阅读 · 0 评论 -
NLP之获得文本语料和词汇内容(1)
2.1获取文本语料库基本语料库函数的说明原创 2021-03-18 09:32:36 · 77 阅读 · 0 评论 -
NLP之练习题(1)
from nltk.book import*print(12/(4+1))print(26**100)print([‘Monty’,‘Python’]20)print(3sent1)print(len(text2))print(sorted(set(text2)))print(text2.dispersion_plot([‘Elinor’,‘Marianne’,‘Edward’,‘Willoughby’]))7 .print(text5.collocatio原创 2021-03-17 19:38:16 · 444 阅读 · 1 评论 -
NLP之语言处理与Python(2)
1.4回到python:决策与控制控制:程序设计的一个关键特征是让机器能够按照我们的医院决策,在遇到特定条件时执行特定命令,或者对文本数据源从头到尾不断循环指导条件满足。这一特征被称为控制。from nltk.book import*关系运算print(sent7)print([w for w in sent7 if len(w)>7])print([w for w in sent7 if len(w)>=7])print([w for w in sent7 if len(w)!原创 2021-03-15 22:26:36 · 117 阅读 · 0 评论 -
NLP之语言处理与Python(1)
1.1语言计算:文本和词汇NLTK入门第一步是在python提示符后输入一个特殊的命令,告诉解释器去加载一些我们要用的文本:from nltk.book import* # 以下所有操作均在此操作下进行找到文本print(text1) #这里只能看到该文件的标题print(text2)print(text3)print(text4)...搜索文本#.concordance() 找特定词以及上下文#搜索text1文本中monstrous出现的情况,包括它的上下文print(tex原创 2021-03-15 21:05:56 · 193 阅读 · 0 评论 -
ntlk入门函数
#from nltk.book import *; #导入NTLK包中book中的所有的例子模型#print(text1); #输出book中text1的相关信息#text1.concordance(“monstrous”); #在text1中找到特定单词并显示出上下文#print(“monstrous in text1 similar to”);#text1.similar(“monstrous”); #在text1找到用法、意义与该单词相似的词#print();#print转载 2021-03-13 15:23:22 · 160 阅读 · 0 评论