ansj分词器是使用java语言进行编程实现的中文分词器,分词速度达到每秒大约200万次左右,准确率高达95%以上,目前实现了用户自定义字典,数字识别,机构名识别,人名识别,新词发现等功能,可以应用到自然语言处理等方面,对于各大项目都能够使用。
baseAnalysis基本分词,保证了最基本的分词,所涉及到的大约10万词,但查找速率快,准确率高
toAnalysis精准分词,它在易用性稳定性准确性上都是不错的平衡
NLPAnalysis nlp分词,具有用户自定义字典,数字识别,人名识别,地名识别,机构名识别,新词发现的功能,分词最为准确
indexAnalysis面向索引分词,用于索引环节的中文分词
dicAnalysis 自定义词典分词,自己定义所需的词典,当你在进行分词时候,会优先使用你自己定义的词进行分词。