elasticsearch入门与安装
elasticsearch入门
定义
elasticsearch是一个高度可扩展的开源全文搜索和分析引擎,它允许你快速、近实时的存储、搜索和分析大量数据。
基本术语
- Near Realtime(NRT)【近实时性】:elasticsearch是一个近实时搜索平台。
- cluster【集群】:集群是一个或者多个节点(服务器)的集合,它们共同保存您的整个数据,并提供跨所有节点的联合索引和搜索功能。
- node【节点】:节点是作为集群一部分的单个服务器,存储数据并参与集群的索引和搜索功能。
- inde【索引】:类似于mysql中的表,索引是具有默写类似特征的文档集合。
- Type【类型】:在6.0.0中弃用,曾经是索引的逻辑类别/分区,允许您在同一索引中存储不同类型的文档。类似于MySQL 数据库中的表。例如,一种类型用于用户,另一种类型用于博客帖子。在当前版本中一个索引下面只能有一个类型,并且将在更高版本中删除类型的整个概念。
- Document【文档】:文档是一个可被索引的数据的基础单元。
- shards【分片】:索引中可能会存储大量超过单个节点的硬件存储限制的数据,比如一个索引中存放的数据远远超过其节点所能存储的范围,为解决这个问题,elasticsearch提供了可将索引分为多个,称为分片的功能。创建索引时,只需定义所需的分片数即可,每个分片本身都是一个功能齐全且独立的“索引”,它可以部署在集群中的任何节点上。
分片很重要,有两个主要原因:
①它允许水平拆分/缩放内容量
②它允许跨分片(可能在多个节点上)分布和并行化操作,从而提高性能/吞吐量 - Replicas【副本】:副本事实上是一种故障恢复机制,elasticsearch允许将索引分片的一个或多个制成所谓的副本,防止其因为某些原因丢失或去除。
副本很重要,有两个主要原因:
①高可用,它提供了高可用来防止分片或节点宕机
②高并发,它允许你的分片可以提供超出自身吞吐量的搜索服务,搜索行为可以在分片所有的拷贝中并行执行。 - Field【字段】:文档以json格式表示,而json由字段组成。字段常见的数据类型有:字符串、数值型、布尔、日期、二进制、范围。
elasticsearch安装
下载地址:官网
Windows下安装
- 下载之后,解压到指定目录
- 安装中文分词插件,在elasticsearch-6.2.2\bin目录下执行以下命令:
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.2/elasticsearch-analysis-ik-6.2.2.zip
- 运行bin目录下的elasticsearch.bat启动Elasticsearch
kibana安装
kibana作为elasticsearch的客户端,下载时需要下载相同版本号的应用。
我上面elasticsearch用的是6.2.2版本的,这里kibana也需要用6.2.2版本的。
官网
将下载好的版本解压到指定目录:
- 运行bin目录下的kibana.bat,启动Kibana的用户界面
- 访问http://localhost:5601 即可打开Kibana的用户界面:
成功访问!