正向最大匹配算法是我国最早提出的解决中文分词问题的算法,因其简单易操作,至今仍作为机器分词的粗分算法,在今天看来,这种算法的准确率远不够高,无法达到令人满意的要求。这只是一次练习。
待切分文本是:
我和你共同创造美好的新生活
词典:
共同,创造,美好,的,新,生活
预期分词效果:
我 和 你 共同 创造 美好 的 新 生活
# Python 3.4.3
lexicon = ('共同','创造','美好','的','新','生活') # 为了方便,词典直接写在程序里。
wordSeg = [] # 新建列表存放切分好的词
maxWordLen = 3