lucene分词部分源码阅读-分词流程
分词入口:子类调用 Analyzer.totkenStream(String fieldName,Read read)。构建分词器,读入待分词文本。
子类中实现createComponents方法
将需要的Tokenizer,及Filter传入TokenStreamComponents ,TokenStreamComponents是Analyzer的内部类。
返回对象为包装...
原创
2020-01-13 15:19:33 ·
236 阅读 ·
0 评论