- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 基于N-gram的双向最大匹配中文分词
这次实验的内容是中文分词。将一个句子的所有词用空格隔开,将一个字串转换为一个词序列。而我们用到的分词算法是基于字符串的分词方法中的正向最大匹配算法和逆向最大匹配算法。然后对两个方向匹配得出的序列结果中不同的部分运用Bi-gram计算得出较大概率的部分。最后拼接得到最佳词序列。
2016-12-05 16:16:13 13623 12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
mqsee.blog.csdn.net
这次实验的内容是中文分词。将一个句子的所有词用空格隔开,将一个字串转换为一个词序列。而我们用到的分词算法是基于字符串的分词方法中的正向最大匹配算法和逆向最大匹配算法。然后对两个方向匹配得出的序列结果中不同的部分运用Bi-gram计算得出较大概率的部分。最后拼接得到最佳词序列。
2016-12-05 16:16:13 13623 12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人