自然语言处理算法-Max Match的python实现
简介MaxMatch (或maximum matching)是用于中文等不用空格分隔词和词的语言的一种常用分词(Word Segmentation)方法,顾名思义,它的思想就是匹配最长的词用来进行词的切分。这种方法在中文使用效果非常好。 该算法的进行需要一个字典,即词汇表(网上可以找到很多资源)。这个方法非常简单,从句子的起始位置开始,从词汇表中找到最长的能匹配到的词汇,将这个词“切“出来,...
原创
2018-07-01 21:36:38 ·
2649 阅读 ·
0 评论