![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
Lieb_Mark
这个作者很懒,什么都没留下…
展开
-
NLP06 : TF-IDF特征处理
TF-IDF TF是词频,一个给定的词语在该文件中出现的频率 分母代表包含词语的文件数目,如果该词语不在语料库中,就会导致分母为零,因此一般情况下使用作为分母原创 2022-06-27 13:49:43 · 247 阅读 · 0 评论 -
NLP05 : 形态分析
形态分析原创 2022-06-27 13:47:22 · 120 阅读 · 0 评论 -
NLP04 : 汉语分词
最大匹配算法: 最少分词法(最短路径法) : 请同学们利用人民日报语料库或自己构建的语料库(30词以上)作为词典,任选五个句子,并基于正向最大匹配算法和最短路径法分别对这五个句子进行分词,并分别计算分词结果的正确率,召回率和F-测度值。输出句子,基于两种算法的分词结果和其对应的评价指标值。...原创 2022-06-27 13:45:23 · 250 阅读 · 0 评论 -
NLP02 : 二元文法模型
请同学们使用免费的中文分词语料库,如人民日报语料库PKU,使用语料库中的常见词编写一个句子,使用二元语法(即每个词只与和它相邻的前一个词有关)在语料库中对句子中的词进行词频统计,输出句子的出现概率。...原创 2022-06-27 13:42:15 · 1555 阅读 · 1 评论 -
NLP01 : 形式语言和自动机
形式语言和自动机原创 2022-06-27 13:38:04 · 290 阅读 · 0 评论