自然语言处理教程
此教程为本人自学和使用经验总结帖,不定时更新和维护。
白日梦想嘉
热爱的心,是日不落的国。
展开
-
自然语言处理入门----中文分词原理
1.中文分词原理介绍1.1 中文分词概述中文分词(Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。1.2 中文分词方法介绍现有的分词方法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。1.2.1 基于字符串匹配的分词方法基于字符串匹配...转载 2018-12-20 13:41:34 · 573 阅读 · 0 评论 -
HMM与序列标注
隐马尔可夫模型(Hidden Markov Model,HMM)是一种统计模型,它用来描述一个含有隐含未知参数(隐状态)的马尔可夫过程。其难点是从可观察的参数中(显状态)确定该过程的隐含参数(隐状态),然后利用这些参数来作进一步的分析。举一个经典的例子:一个东京的朋友每天根据天气{下雨,天晴}决定当天的活动{公园散步,购物,清理房间}中的一种,我每天只能在twitter上看到她发的推特,我前天...转载 2019-01-03 09:50:49 · 974 阅读 · 0 评论