ElasticSearch取经之路(持续更新中)

本文用QA的方式记录我在实战中学习和使用Elasticsearch遇到和问题以及对应的解决方案。

1. 有用的教程和学习资料

中文官网(版本有点低):https://www.elastic.co/guide/cn/elasticsearch/guide/current/foreword_id.html

英文官网:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

官网论坛(类似于百度知道):https://discuss.elastic.co/search?q=

其他有帮助的资料:
http://www.jeepxie.net/article/350717.html
https://juejin.im/post/6844903887044870152

2. 安装与启动

(官网也给了对应的安装和启动步骤,想了解详情的童鞋也可以看官网)

2.1 源码安装(适用于Windows和Ubuntu)

一. 安装JAVA
     JAVA安装比较方便,在JAVA官网添加链接描述选择对应系统的安装包,直接下载并安装即可
二. 配置JAVA环境变量
     JAVA的安装路径赋予到JAVA_HOME这个环境变量中(这里不进行展开,可以在网上搜索对应的操作方式)
三. 下载ElasticSearch
     可以在ElasticSearch官网的说明文档下载对应的文件,直接解压就ok了
四. 启动
     按ElasticSearch官网运行对应的文件即可

2.2 Docker安装

官网也有相应的Docker安装,但是注意:如果Windows下使用Docker,Docker会默认只使用部分的CPU和内存资源,而ElasticSearch是一个十分依赖CPU和内存的。幸运的是,Docker在windows下想要修改这些设置也是非常方便的,可以直接在Docker Desktop客户端即可修改,无需任何代码。对速度有要求的童鞋要注意这一点,免得踩坑。

3.有没有可以高效直接的工具监控ElasticSearch集群的信息和状态?

:我用的是一个ElasticSearch-HQ工具,安装也是十分方便。有需要的童鞋可以见他们的github项目地址,该工具的网页视图如下:
在这里插入图片描述
该工具不仅可以查看集群信息,还可以在上面进行检索(本人实测觉得贼赞)

4. 如何在多机器部署分布式的ElasticSearch

前备条件:

  1. 多台机器
  2. 机器之间能互相ping得通
  3. 在多台机器中,在config/elasticsearch.yaml文件里,添加下列信息
    cluster.name: test       # 必填,而且多个机器的cluster名字必须一致
    node.name: node1      # 必填,而且多个机器的node名字必须不一样
    node.roles: [master, data]       # 必填,确定节点的角色
    http.port: 9200      # 选填,该节点对外被访问的接口号
    network.host: 10.0.0.1     # 必填,填本机的IP地址,不能是localhost
    discovery.seed_hosts: [10.0.0.1, 10.0.0.2, 10.0.0.3]      # 必填,填所有机器的IP地址。(据说不一定需要所有,有待验证)
    cluster.initial_master_nodes: [node1, node2]     # 必填,用来确定master的候选节点,填节点名字,不是节点的IP

在多机器部署分布式的ElasticSearch时,一个很自然的问题是:如何实现机器间的通信?
首先介绍一下我对ElasticSearch节点间通信的理解。每次启动ElasticSearch就是启动了一个节点,如官网所述,只要节点的cluster.name一致,则不同的节点变会自动地加入到同一个集群。这一点对于在本地启动多个节点地时候比较好理解,因为直观理解就是本地节点间的通信完全不会是问题。但是如果拓展到多机器,一个节点怎么去发现别的节点呢?难道ElasticSearch自动把所有的节点信息都上传到一个数据库里边,然后让节点在这个库里面找吗?这显然不可能。

实现多机器自动加入集群的一个直观做法是:告诉节点,你要去哪些地方(也就是其他机器地址) 找你的 失散兄弟(其他节点),因此配置中的network.hostdiscovery.seed_hosts便是实现机器间通信的至关重要的设置。

若不设置network.host,这个设置可以理解为该节点的身份证,该节点默认采取localhost,若在本地开启多个节点,大家都是拿着本地身份证,因此互相找到对方是很自然的事情(事实上,ElasticSearch会监听某些端口如9300-9305,发现是否存在其他的节点,因此实现自动加入集群的目的)。但是如果在多机器情况下,保持localhost身份证就会存在问题,你拿着本地身份证,怎么可能在全球找人呢?因此,需要将本地身份证localhost换成全球身份证10.0.0.1,这样你就可以肆无忌惮地寻找你的兄弟萌了。

接下来,很自然地,==discovery.seed_hosts: [10.0.0.1, 10.0.0.2, 10.0.0.3]==便是告诉当前节点,“你去这几个地方就好”,其实节点是瞎子,他并不认路,必须需要有人指路才行。

5. BUG Q&A

BUG-1
在启动一个节点的时候出现了这个bug

 [2020-09-03T11:42:43,730][WARN ][o.e.c.c.ClusterFormationFailureHelper] [node1] master not discovered or elected yet, an election requires a node with id [iNI08wa2SnWuMiy_B9ooUQ], have discovered [{node1}{PyssdnIiT_6lnb0pJP4PZQ}{mEvolSE4QyqTx_JwBHIreg}{10.0.1.6}{10.0.1.6:9300}{dm}{xpack.installed=true, transform
.node=false}] which is not a quorum; discovery will continue using [10.0.1.7:9300, 10.0.1.9:9300] from hosts providers and [{node1}{PyssdnIiT_6lnb0pJP4PZQ}{mEvolSE4QyqTx_JwBHIreg}{10.0.1.6}{10.0.1.6:9300}{dm}{xpack.installed=true, transform.node=false}] from last-known cluster state; node term 4, last-accepted v
ersion 45 in term 2

Solution

把path.data对应路径的所有文件删除

6. 其他trick

elasticsearch设置的最大搜索条数是10000,如需要修改
https://blog.csdn.net/hhj724/article/details/73909813
https://blog.csdn.net/weixin_43876919/article/details/103292463?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值