- 博客(1)
- 资源 (6)
- 收藏
- 关注
原创 谈谈opennlp maxent
背景:最大熵模型可用于文本分类 简介maxme是个非常不错的最大熵java实现 主要的功能还是分为两部分特征提取和GIS迭代算法 1)特征提取采取了简单将分词作为特征,目前只支持单个字段,但如过要实现多字段特征也是很简单的事情。 2)GIS迭代算法没什么好说的,大量的数学推导,从数学上保证了解的唯一性和迭代收敛 流程1)整个训练流程就是读取每行文本---》分词成特征----》迭代计算----》最后生成每个特征对于输出分类的权重 2)整个分类过程就是读取样本(一行)---》分词成特征-----》根据每
2010-09-08 20:48:00 4044 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人