在作词时发现JE不是很好用,象美白,祛斑,这些词根本搜索不出来,找不到更好的分词库,一元法又很耗CPU所以决定用二分法。
在lucene 2.0+heritrix一书中提到 ChineseAnalyzer中用的是二分切词法,- -试验半天才发现根本不是那么回事,真正的二分切词法是CJKAnalyzer。尽信书不如无书,是句真理啊。
在作词时发现JE不是很好用,象美白,祛斑,这些词根本搜索不出来,找不到更好的分词库,一元法又很耗CPU所以决定用二分法。
在lucene 2.0+heritrix一书中提到 ChineseAnalyzer中用的是二分切词法,- -试验半天才发现根本不是那么回事,真正的二分切词法是CJKAnalyzer。尽信书不如无书,是句真理啊。