1、百度面试题:正向最大匹配分词,怎么做最快? 用所有词生成一个字典树,匹配的过程就是查字典的过程( hash就是这种思想的体现)。 假设我们有两个词”百度“,”百家姓“,那么生成的字典树就是: 百---度* | |-----家----姓* 其中“度”和“姓”旁边的星号表示这是一个有效词。 对于句子“百度面试题“,首先在字典中找”百“,找到了;继续向下查找”度“,又找到了;继续向下查找”面“,没有找到。那么”百度“就是我们分出来的第一个词。