Lucene
柯之梦
我是一名有梦想的码农,你可以关注我的公众号(IT技术乱弹)获取更多技术知识。
展开
-
Lucene索引详解
今天我给大家讲讲Lucene是如何索引文档的,索引文档就是把文档变成索引这种数据结构的过程。 文档是Lucene索引的基本单位,比文档更小的单位是字段,字段是文档的一部分,每个字段由名称、类型和取值组成。字段的取值一般为文本(字符串、字符流)、二进制类型和数值类型。Lucene中的字段类型主要有以下几种: TextField: ...原创 2019-01-23 23:44:51 · 1411 阅读 · 0 评论 -
Lucene分词详解
分词和查询都是以词项为基本单位,词项是词条化的结果。在Lucene中分词主要依靠Analyzer类解析实现。Analyzer类是一个抽象类,分词的具体规则是由子类实现的,所以对于不同的语言规则,要有不同的分词器 1. StopAnalyzer 停用词分词器:能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。 2. StandardAnal...原创 2019-01-22 08:55:47 · 1477 阅读 · 0 评论