机器学习
t_tamir
live and let live
展开
-
命名实体识别(named entity recognition )基于统计方法的技术比较
1、命名实体识别的主要技术方法分为:基于规则和词典的方法、基于统计的方法、二者混合的方法等,接下来主要介绍基于统计的方法研究。基于统计的方法利用人工标注的语料进行训练,标注语料时不需要广博的语言学知识,并且可以在较短时间内完成。基于统计机器学习的方法主要包括:隐马尔可夫模型(HiddenMarkovMode,l HMM)、最大熵(Maxmi umEntropy,ME)、支持向量机(Support原创 2015-09-10 17:17:35 · 4651 阅读 · 0 评论 -
条件随机场学习笔记(1)
1、离散马尔科夫过程 该过程的特点是当前的状态仅仅与它之前的一个状态有关。 状态转移概率有两个属性,大于零,转移矩阵的每一个横行加一起来和为1.2、隐马尔科夫要素 五元组:两个模型参数和三个概率矩阵。 N: 模型中状态数 M:输出字符的个数 A:状态转移概率分布 B:观察字符在状态j时的概率分布 π原创 2015-09-07 11:04:48 · 350 阅读 · 0 评论