在google code上又开源了一个项目(http://code.google.com/p/lightwords/ ):
lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。
在google code上又开源了一个项目(http://code.google.com/p/lightwords/ ):
lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。