功能:
(1)分布式的搜索引擎和数据分析引擎
(2)全文检索,结构化检索,数据分析
(3)海量数据近实时的处理
适用场景:
(1)全文检索,搜索推荐
(2)日志数据分析
(3)数据挖掘
(4)github开源代码管理
核心概念:
(1)NRT:近实时,从写入es到被检索查询有1秒
(2)Cluster:集群
(3)Node:节点,es的节点名称默认是随机分配的,节点启动默认会加入名称叫做"elasticsearch"的集群。
(4)document:文档
(5)Index:索引,包含相似结构文档数据
(6)Type:类型,一个索引下建议只有一个type,每个type下的field是相同的。es6以后type移除了。
(7)shard:数据块,es会将一个索引切分成多个shard。每个shard可以横向扩展,提高吞吐量和性能。每个shard即是一个lucene实例
(8)replica:副本,shard的副本,读请求可以请求shard的副本。写请求只能请求primary shard(主shard)