- 博客(2)
- 收藏
- 关注
原创 中文分词的python实现-基于HMM算法
隐马尔科夫模型(HMM)模型介绍HMM模型是由一个“五元组”组成:StatusSet: 状态值集合ObservedSet: 观察值集合TransProbMatrix: 转移概率矩阵EmitProbMatrix: 发射概率矩阵InitStatus: 初始状态分布
2016-09-29 23:44:55 13300 22
原创 中文分词的python实现-基于FMM算法
正向最大匹配算法(FMM)正向最大匹配算法(FMM)是一种基于词典的分词方法,思想很简单就是从左向右扫描寻找词的最大匹配,比如词典中同时含有“钓鱼”和“钓鱼岛”,那“钓鱼岛属于中国”就会被分词成“钓鱼岛/属于/中国”
2016-09-28 19:44:05 5428 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人