自然语言处理
文章平均质量分 96
大地之灯
这个作者很懒,什么都没留下…
展开
-
NLTK3:文本分类与文本信息抽取
目录0. nltk的分类器介绍0.1分类器示例0.2 基于上下文的词性标注器1.信息抽取2.分块2.1关于命名实体识别2.2 基于正则的匹配2.3 处理递归2.4基于分类的分块器2.5 命名实体识别2.6 关系抽取参考链接1参考链接20. nltk的分类器介绍在NLTK中提供了NaiveBayesClassifier,DecisionTreeClassifier,MaxentClassifier三种类型的分类器。分类器都提供了类方法可以训练出一个分类器实例,有了这个实例,便能对新的样本进行分类预测,转载 2022-05-04 19:59:33 · 2046 阅读 · 0 评论 -
NLTK2:词性标注
目录1. 使用NLTK对英文进行词性标注1.1词性标注示例1.2 语料库的已标注数据2 标注器2.1 默认标注器2.2 正则表达式标注器2.3 查询标注器3 训练N-gram标注器3.1 一般N-gram标注3.2 组合标注器4.更进一步5.中文标注器的训练6. brown语料库相关方法参考链接2参考链接3参考链接1自然语言是人类在沟通中形成的一套规则体系。规则有强有弱,比如非正式场合使用口语,正式场合下的书面语。要处理自然语言,也要遵循这些形成的规则,否则就会得出令人无法理解的结论。下面介绍一些术原创 2022-05-04 10:48:57 · 1941 阅读 · 0 评论 -
NTLK1 :简单文本分析
参考链接1参考链接2import nltkimport jiebaimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inlineplt.rcParams['font.sans-serif'] = 'SimHei'plt.rcParams['axes.unicode_minus'] = False%config InlineBackend.figure_format = 's原创 2022-04-26 18:39:11 · 215 阅读 · 0 评论