1.1 基本概念和原理
ES是什么:
- Elasticsearch 是实时的分布式搜索分析引擎,内部使用 Lucene 做索引与搜索。
- Lucene 是 Java 语言编写的全文搜索框架,用于处理纯文本的数据,但它只是一个库,提供建立索引、执行搜索等接口,但不包含分布式服务,这些正是 ES 做的。
- 什么是全文?对全部的文本内容进行分析,建立索引,使之可以被搜索,因此称为全文。
ES 可以用来做什么:
- 搭建自己的搜索引擎,用于分析日志
- 配合开源爬虫建立某个垂直领域的搜索引擎
- 通过聚合功能,进行数据分析、统计,生成指标数据