ElasticSearch使用介绍以及实例搭建集群环境图形界面管理方式
一. ElasticSearch简单介绍
1、ElasticSearch简单介绍
ElasticSearch是一个基于Lucene(全文搜索引擎)的搜索服务器。通常用于日志收集。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web(专业版和更高级版本)接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。
2、ElasticSearch常用的工作方式
- 分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索。
- 实时分析的分布式搜索引擎。
- 可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据。
3、生产环境中Elasticsearch使用的案例
- 维基百科使用Elasticsearch来进行全文搜做并高亮显示关键词,以及提供search-as-you-type、did-you-mean等搜索建议功能。
- 英国卫报使用Elasticsearch来处理访客日志,以便能将公众对不同文章的反应实时地反馈给各位编辑。
- StackOverflow将全文搜索与地理位置和相关信息进行结合,以提供more-like-this相关问题的展现。
- GitHub使用Elasticsearch来检索超过1300亿行代码。
- 每天,Goldman Sachs使用它来处理5TB数据的索引,还有很多投行使用它来分析股票市场的变动。
二、 Elasticsearch数据写入过程描述
Lucene 把每次生成的倒排索引,叫做一个段(segment)。然后另外使用一个 commit (提交)文件,记录索引内所有的 segment。而生成 segment 的数据来源,则是内存中的 buffer(缓冲区)。
1) 数据写入进入ES内存 buffer (同时记录到translog(预写日志)生成倒排索引分片(segment)
- 由于Elasticsearch 在把数据写入到内存 buffer 的同时,其实还另外记录了一个ranslog日志,如果在这期间故障发生时,Elasticsearch会从commit位置开始,恢复整个translog文件中的记录,保证数据的一致性。
2) 将 buffer 中的 segment 先同步到文件系统缓存中,然后再刷写到磁盘
- 由于在buffer中的索引片先同步到文件系统缓存,再刷写到磁盘,因此在检索时可以直接检索文件系统缓存,保证了实时性。
三、实例搭建集群环境图形界面管理方式
1、实验准备
- 两台网络通畅Linux服务器,尽量使用7.4版本。
| 数量 | 主机名 |
|---|
本文详细介绍了ElasticSearch的基本概念、工作方式,以及如何在Linux环境下搭建ElasticSearch集群,并通过elasticsearch-head插件实现图形化管理。内容包括数据写入过程、环境准备、软件包下载、节点配置、Java环境检查、插件安装和集群健康状态检查。
最低0.47元/天 解锁文章
干货亲测软件包)&spm=1001.2101.3001.5002&articleId=109333266&d=1&t=3&u=a5c803fa309445cb8865ad6d3d8fd3b4)

被折叠的 条评论
为什么被折叠?



