最全Elasticsearch数据库_es数据库(2)，2024年最新大数据开发高级工程师进阶学习

本文链接：https://blog.csdn.net/2301_76348014/article/details/138547096

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

2.7 安装jdk环境

//上传jdk安装包
[root@localhost src]# ls
debug  elasticsearch-6.8.20.tar.gz  jdk-8u131-linux-x64.tar.gz  kernels

//解压安装包
[root@localhost src]# tar xf jdk-8u131-linux-x64.tar.gz -C /usr/local/

//添加环境变量
[root@localhost src]# vim /etc/profile
末尾添加
 78 #JAVA\_HOME
 79 export JAVA\_HOME=/usr/local/java
 80 #JRE\_HOME
 81 export JRE\_HOME=/usr/local/java/jre
 82 #CALSSPATH
 83 export CLASSPATH=$CLASSPATH:${JAVA\_HOME}/lib:${JRE\_HOME}/lib
 84 #PATH
 85 export PATH=$PATH:${JAVA\_HOME}/bin:${JRE\_HOME}/bin

//重命名
[root@localhost ~]# mv /usr/local/jdk1.8.0\_131/ /usr/local/java
[root@localhost ~]# source /etc/profile
[root@localhost ~]# java -version
java version "1.8.0\_131"
Java(TM) SE Runtime Environment (build 1.8.0_131-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

2.8 切换es用户启动数据库

[root@localhost ~]# su es
[es@localhost root]$ /usr/local/es/elasticsearch-6.8.20/bin/elasticsearch &

2.9 systemctl管理

2.10 访问

用浏览器访问ip:9200（安装的设备9200端口），看到如下的说明安装成功：
在这里插入图片描述

3. kibana

3.1 kibana介绍

Kibana是一个开源的分析与可视化平台，设计出来用于和Elasticsearch一起使用的。你可以用kibana搜索、查看存放在Elasticsearch中的数据。Kibana与Elasticsearch的交互方式是各种不同的图表、表格、地图等，直观的展示数据，从而达到高级的数据分析与可视化的目的。
Elasticsearch、Logstash和Kibana这三个技术就是我们常说的ELK技术栈，可以说这三个技术的组合是大数据领域中一个很巧妙的设计。一种很典型的MVC思想，模型持久层，视图层和控制层。Logstash担任控制层的角色，负责搜集和过滤数据。Elasticsearch担任数据持久层的角色，负责储存数据。而我们这章的主题Kibana担任视图层角色，拥有各种维度的查询和分析，并使用图形化的界面展示存放在Elasticsearch中的数据。

3.2 安装kibana

官网下载地址：
https://www.elastic.co/cn/downloads/past-releases#kibana

3.3 上传安装包

//使用rz命令或者xftp上传
[root@localhost src]# ls
debug  elasticsearch-6.8.20.tar.gz  jdk-8u131-linux-x64.tar.gz  kernels  kibana-6.8.20-linux-x86_64.tar.gz

3.4 解压文件

[root@localhost src]# tar xf kibana-6.8.20-linux-x86\_64.tar.gz -C /usr/local/

3.5 修改配置文件

//下列的序号为行号
[root@localhost src]# vim /usr/local/kibana-6.8.20-linux-x86\_64/config/kibana.yml
7 server.host: "192.168.5.55"                           //ES服务器主机地址
28 elasticsearch.hosts: ["http://192.168.5.55:9200"]    //ES服务器地址

3.6 启动

[root@localhost src]# cd /usr/local/kibana-6.8.20-linux-x86\_64/
[root@localhost kibana-6.8.20-linux-x86_64]# ./bin/kibana &

3.7 浏览器访问

http://192.168.5.55:5601/app/kibana
在这里插入图片描述

4. Elasticsearch高可用集群

4.1 ES是如何解决高并发

ES是一个分布式全文检索框架，隐藏了复杂的处理机制，核心内容分片机制、集群发现、分片负载请求路由。

4.2 ES基本概念名词

Cluster

代表一个集群，集群中有多个节点，其中有一个为主节点，这个主节点是可以通过选举产生的，主从节点是对于集群内部来说的。es的一个概念就是去中心化，字面上理解就是无中心节点，这是对于集群外部来说的，因为从外部来看es集群，在逻辑上是个整体，你与任何一个节点的通信和与整个es集群通信是等价的。

Shards

代表索引分片，es可以把一个完整的索引分成多个分片，这样的好处是可以把一个大的索引拆分成多个，分布到不同的节点上。构成分布式搜索。分片的数量只能在索引创建前指定，并且索引创建后不能更改

replicas

代表索引副本，es可以设置多个索引的副本，副本的作用一是提高系统的容错性，当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率，es会自动对搜索请求进行负载均衡。

Recovery

代表数据恢复或叫数据重新分布，es在有节点加入或退出时会根据机器的负载对索引分片进行重新分配，挂掉的节点重新启动时也会进行数据恢复。

4.3 ES为什么要实现集群

ES集群中索引可能由多个分片构成，并且每个分片可以拥有多个副本。通过将一个单独的索引分为多个分片，我们可以处理不能在一个单一的服务器上面运行的大型索引，简单的说就是索引的大小过大，导致效率问题。不能运行的原因可能是内存也可能是存储。由于每个分片可以有多个副本，通过将副本分配到多个服务器，可以提高查询的负载能力。

ES集群核心原理分析：

每个索引会被分成多个分片shards进行存储，默认创建索引是分配5个分片进行存储。
每个分片都会分布式部署在多个不同的节点上进行部署，该分片成为primary shards。
注意：索引的主分片primary shards定义好后，后面不能做修改。
为了实现高可用数据的高可用，主分片可以有对应的备分片replics shards，replic shards分片承载了负责容错、以及请求的负载均衡。

注意: 每一个主分片为了实现高可用，都会有自己对应的备分片，主分片对应的备分片不能存放同一台服务器上（单台ES没有备用分片的）。主分片primary shards可以和其他replics shards存放在同一个node节点上。
在往主分片服务器存放数据时候，会对应实时同步到备用分片服务器：
在这里插入图片描述
但是查询时候，所有（主、备）都进行查询。

主的可以存放副的：
在这里插入图片描述
Node1 ：P1+P2+R3组成了完整的数据！分布式存储

ES核心存放的核心数据是索引!
如果ES实现了集群的话，会将单台服务器节点的索引文件使用分片技术，分布式存放在多个不同的物理机器上。
分片就是将数据拆分成多台节点进行存放
在ES分片技术中，分为主（primary）分片、副(replicas)分片。这样做是为了容错性

5. 高可用ES集群部署

5.1 环境说明

系统环境：
[es@localhost root]$ cat /etc/redhat-release 
CentOS Linux release 7.8.2003 (Core)

主机：

IP地址	节点	数据库版本	可视化工具
192.168.5.55	node1（主）	elasticsearch-6.8.20	kibana-6.8.20
192.168.5.56	node2	elasticsearch-6.8.20
192.168.5.100	node3	elasticsearch-6.8.20

5.2 安装过程

需要准备好三台主机已经安装好ES数据库，安装的过程请查看目录第二节
注：关闭防火墙

5.3 修改配置文件

修改192.168.5.55配置文件
[root@localhost config]# pwd
/usr/local/es/elasticsearch-6.8.20/config
[root@localhost config]# vim elasticsearch.yml
注：前面的序号为行号，标记多少行

前面省略……
17 cluster.name: myes   //集群名称，保证三台集群名字相同
23 node.name: node-1   //当前节点名称，集群内节点名字不能相同
33 path.data: /var/es/data //数据存放目录
37 path.logs: /var/es/log  //日志存放目录
55 network.host: 0.0.0.0   //主机  
59 http.port: 9200        //端口号
68 discovery.zen.ping.unicast.hosts: ["192.168.5.55", "192.168.5.56","192.168.5.100"]  //多个服务集群ip
72 discovery.zen.minimum_master_nodes: 1   //最少主节点数量
89 bootstrap.memory_lock: false     //添加以下两行，开放网络权限
90 bootstrap.system_call_filter: false

剩下的两台利用scp命令远程覆盖配置文件
注意：记得修改节点名称，集群内节点名字不能相同
[root@localhost ~]# cd /usr/local/es/elasticsearch-6.8.20/config/
[root@localhostconfig]# scp elasticsearch.yml root@192.168.5.56:/usr/local/es/ 
elasticsearch-6.8.20/config/

5.4 启动es数据库

三台依次启动
[root@localhost config]# su es
[es@localhost config]$ /usr/local/es/elasticsearch-6.8.20/bin/elasticsearch &

5.5 集群测试

通过浏览器访问如下地址查看集群启动状态
192.168.5.55:9200/_cat/health?v
在这里插入图片描述

//查看集群信息
[root@localhost config]# curl 192.168.5.55:9200/\_cat/nodes
192.168.5.56  14 96 1 0.05 0.15 0.13 mdi - node-2
192.168.5.100 14 90 0 0.00 0.06 0.06 mdi - node-3
192.168.5.55  23 97 2 0.00 0.04 0.05 mdi * node-1  带*号表示主节点

//检查分片是否正常

 [root@localhost ~]# curl 192.168.5.55:9200/\_cat/shards
.kibana_task_manager            0 p STARTED     2   6.8kb 192.168.5.55  node-1
.kibana_task_manager            0 r STARTED     2   6.8kb 192.168.5.56  node-2
.kibana_1                       0 p STARTED     4  19.8kb 192.168.5.56  node-2
.kibana_1                       0 r STARTED     4  19.8kb 192.168.5.100 node-3
.monitoring-kibana-6-2023.05.15 0 p STARTED  2194 747.9kb 192.168.5.55  node-1
.monitoring-kibana-6-2023.05.15 0 r STARTED  2194 680.4kb 192.168.5.100 node-3
.monitoring-kibana-6-2023.05.12 0 p STARTED  1180   420kb 192.168.5.56  node-2
.monitoring-kibana-6-2023.05.12 0 r STARTED  1180   420kb 192.168.5.100 node-3
.monitoring-es-6-2023.05.15     0 p STARTED 28065    14mb 192.168.5.55  node-1
.monitoring-es-6-2023.05.15     0 r STARTED 28065    14mb 192.168.5.56  node-2
.monitoring-es-6-2023.05.12     0 p STARTED 11490   5.6mb 192.168.5.55  node-1
.monitoring-es-6-2023.05.12     0 r STARTED 11490   5.6mb 192.168.5.100 node-3

P 表示primar shard 主分片，前面的数字表示分片数量
R 表示 replica shard 副本分片

5.6 验证ES集群故障转移

注意实心星号的是主节点，我们尝试将 192.168.5.55 节点服务关闭，验证，主节点是否进行重新选举，并再次启动 192.168.5.55，看看是否变成候选节点：
[root@localhost ~]# ps -ef | grep /usr/local/es/ela
[root@localhost ~]# kill -9 3184

[es@localhost config]$ curl 192.168.5.56:9200/_cat/nodes
192.168.5.56  21 96 1 0.03 0.02 0.05 mdi - node-2
192.168.5.100 24 95 1 0.30 0.10 0.07 mdi * node-3

发现 192.168.5.100变成了主节点，然后启动 192.168.5.55，验证其是否变成了候选节点
[root@localhost ~]# curl 192.168.5.55:9200/\_cat/nodes
192.168.5.100 27 94 2 0.08 0.08 0.07 mdi * node-3
192.168.5.55  26 96 1 0.97 0.25 0.12 mdi - node-1
192.168.5.56  22 96 1 0.03 0.03 0.05 mdi - node-2

6. 配置kibana监控集群

6.1 修改配置文件

安装过程请查看目录第三部分

修改配置kibana配置文件
[root@localhost ~]# vim /usr/local/kibana-6.8.20-linux-x86\_64/config/kibana.yml
7 server.host: "0.0.0.0"  //服务器主机地址
//集群ip端口号
28 elasticsearch.hosts: ["http://192.168.5.55:9200","http://192.168.5.56:9200",
"http://192.168.5.100:9200"]

[root@localhost ~]# cd /usr/local/kibana-6.8.20-linux-x86\_64/bin/
[root@localhost bin]# ./bin/kibana &

6.2 访问

成功监控到整个集群
在这里插入图片描述

6.3 验证分片

三个节点正常的时候下面显示是16个分片
Node1：5个
Node2: 6个
Node3：5个
在这里插入图片描述
模拟故障：
现在把node1节点关掉，正常应该是node1节点的五个分片会重新分配给剩下的两个节点，使总数到达16个分片

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

模拟故障：
现在把node1节点关掉，正常应该是node1节点的五个分片会重新分配给剩下的两个节点，使总数到达16个分片

[外链图片转存中…(img-DrA4oM3p-1715089713514)]
[外链图片转存中…(img-NElGdJPV-1715089713515)]
[外链图片转存中…(img-O6XZnrwo-1715089713515)]

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

最全Elasticsearch数据库_es数据库(2)，2024年最新大数据开发高级工程师进阶学习—大数据开发热修复原理

2.7 安装jdk环境

2.8 切换es用户启动数据库

2.9 systemctl管理

2.10 访问

3. kibana

3.1 kibana介绍

3.2 安装kibana

3.3 上传安装包

3.4 解压文件

3.5 修改配置文件

3.6 启动

3.7 浏览器访问

4. Elasticsearch高可用集群

4.1 ES是如何解决高并发

4.2 ES基本概念名词

4.3 ES为什么要实现集群

5. 高可用ES集群部署

5.1 环境说明

5.2 安装过程

5.3 修改配置文件

5.4 启动es数据库

5.5 集群测试

5.6 验证ES集群故障转移

6. 配置kibana监控集群

6.1 修改配置文件

6.2 访问

6.3 验证分片