Lucene的作者是Hadoop.
Lucene的工作原理:
Lucence的查询原理
1.Lucene快的原因,是因为添加数据时候,会对数据进行分词。将分词后的次建立索引,存储到索引库,然后再将真正的内容(文档),也保存起来,存储在文档区域(可以在本地,也可以在HDFS)。
2.查找时,将查询条件分词,先在索引库中查找,如果查找到会返回一个文档ID,然后更具文档ID,再到存储文档中查找真正的内容。
3.倒排索引:根据文字找对应的文章
elasticsearch是java开发的。
elasticsearch:数据存储,查询;kibana: 数据展示;Beats:轻量数据采集;Logstash:动态数据收集管道;X-Pack:数据管理
ES可以做交互式查询,离线分析(用SPARK直接读取数据分析)