- 博客(1)
- 收藏
- 关注
原创 Jiebe学习笔记:viterbi算法
词性标注: Jieba的词性标注模块仍然采用基于HMM模型的viterbi算法,在状态的描述上应用({BMES},词性)二元对。状态集合为{BMSE}这四个词位与词性(39类)的笛卡尔积,也就是有156种状态。 从文本的起始位置开始逐字扫描,判断每个字可能的状态,与状态转移得到的期待状态求与,也就是下一个字可能的状态。与的结果是空集时以期待状态为下一个字的状态,期待状态集为空...
2018-04-17 10:12:59 666
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人