前言
es使用场景
网站搜索,日志索引,数据分析
es几个概念
NRT:从索引一条数据到这条数据可以别检索到时间近一秒
Cluster:集群 集群名:culster_name
注:集群查询 域名
Node:节点集群的一部分 参与索引检索 节点名:uuid
注:集群中节查询 /_cat/nodes
todo搭建索引配置Cluser和多个Node,建索引查询
Index:一个index是一个有相似特征的文档集合 标识名:索引名 iduq操作都是根据索引名
注:集群索引查询 /_cat/indices
索引配置查询 http://commonsearch.you.ctripcorp.com/apptip_v3/_settings
Type:一个index可以定义多个type,一个type,通常一个type是具有相同fields的文档集合
注:索引类型查询 /indexname/_mapping
Document:可以被索引的基本单元,例如一条景点 虽然物理上存在于索引中,但实际上要索引或者说赋予索引的某一个type。
注:文档查询 /indexname/type/docid/
Shards&Replicas:
当索引量较大时,所有索引放到一个node时可能存在内存不够或者请求太慢问题。为了解决这种问题,es提供把索引分为多份shards。每个碎片本身是一个完全有效的、独立的“索引”,可以在集群中的任何节点上承载。
Sharding的两个重要作用:1水平扩展索引内容。2shars上进行分发和并行操作,从而提高性能和吞吐量。
Replicas的两个重要作用: 1提供高可用性如果shard/node失败的话。因此replica的shard不能和 original/primary shard在同一个节点上。2扩展搜索量/吞吐量应为搜索可以在所有副本上执行。
注:es的每个shard对应lucene的一个索引。最大索引量Integer.MAX_VALUE – 128
索引监控:_cat/shards