部署ELK日志分析系统多ElasticSearch集群

最新推荐文章于 2022-07-04 01:04:05 发布

EoinXu

最新推荐文章于 2022-07-04 01:04:05 发布

阅读量601

点赞数 1

分类专栏： Linux系统架构

本文链接：https://blog.csdn.net/qq_42761527/article/details/105108547

版权

Linux系统架构专栏收录该内容

38 篇文章 0 订阅

订阅专栏

部署elasticsearch软件（node1和node2都需要安装）

部署elasticsearch-head插件（node1和node2都需要安装）

创建elasticsearch索引

部署Logstash（Apache服务器上部署）

部署kilbana（node1上部署）

一.案例背景

通常服务器产生的日志信息都存储再计算机本地，当使用多服务器做集群时，日志也会被分散存储到不同的服务器上，分别去查阅这些日志信息，不但繁琐而且效率低下。
最好的办法就是将所有日志集中存储到一台服务器桑统一管理和查阅，这就是集中化的日志管理方式。
集中化日志管理之后，另外一件比较麻烦的事情就是日志的统计和检索。一般使用grep、awk、sed、wc等命令就能是实现检索和统计操作。但是面对庞大的机器数量，面对更高的查询、排序、统计，使用简单的Linux命令就比较麻烦。
于是开源的实时日志分析ELK平台能够解决上述问题。

二.ELK日志分析系统概述

ELK简述

ELK是一套完整的日志解决方案，由ElasticSearch、Logstash、Kibana这三款开源软件组成。
ElasticSearch是实时全文搜索和分析引擎，提供搜集、分析、存储数据三大功能；是一套开放REST和JAVA API等结构提供高效搜索功能，可扩展的分布式系统。它构建于Apache Lucene搜索引擎库之上。
Logstash 是一个用来搜集、分析、过滤日志的工具。它支持几乎任何类型的日志，包括系统日志、错误日志和自定义应用程序日志。它可以从许多来源接收日志，这些来源包括 syslog、消息传递（例如 RabbitMQ）和JMX，它能够以多种方式输出数据，包括电子邮件、websockets和Elasticsearch。
Klbana是一个基于Web的图形界面，用于搜索、分析和可视化存储在 Elasticsearch指标中的日志数据。它利用Elasticsearch的REST接口来检索数据，不仅允许用户创建他们自己的数据的定制仪表板视图，还允许他们以特殊的方式查询和过滤数据。

ELK经典架构工作原理

Logstash部署至服务主机，对各个服务的日志进行采集、过滤、推送。

Elasticsearch存储Logstash传送的结构化数据，提供给Kibana。

Kibana提供用户UIweb页面进行，数据展示和分析形成图表等。

logs 泛指，各种日志文件以及日志信息：windows，negix，tomcat，webserver等等。

在所有需要收集日志的服务器上部署Logstash，作为Logstash agent用于监控并且过滤所收集到的日志，将过滤后的日志内容整合在一起，最终全部交给Elasticsearch检索引擎；可以用ElasticSearch进行自定义搜索，再通过Kibana结合自定义搜索内容生成图表；进行日志数据展示。

Logstash的工作过程

日志数据到达Logstash的Input后，会按行发送给Filter进行处理，处理完成后会把数据交给Output，Output写入到ElasticSearch。Filter是可选项，是一个行处理机制，作用是将提供未格式化的数据整理成需要的数据，也可以不做任何处理直接把源数据库传送给Output

Logstash由input、filter和output三部分组成，

input负责从数据源提取数据，

filter负责解析、处理数据，

output负责输出数据，每部分都有提供丰富的插件。

Elasticsearch基础概念

NRT（接近实时）：lasticsearch是一个接近实时的搜索平台，这意味着，从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟（通常是1秒）。
cluster（集群）：一个集群就是由一个或多个节点组织在一起，它们共同持有你整个的数据，并一起提供索引和搜索功能。其中一个节点为主节点，这个主节点是可以通过选举产生的，并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字，默认是elasticsearch，集群名字很重要，每个节点是基于集群名字加入到其集群中的。因此，确保在不同环境中使用不同的集群名字。一个集群可以只有一个节点。强烈建议在配置elasticsearch时，配置成集群模式。
node（节点）：节点就是一台单一的服务器，是集群的一部分，存储数据并参与集群的索引和搜索功能。像集群一样，节点也是通过名字来标识，默认是在节点启动时随机分配的字符名。当然，你可以自己定义。该名字也很重要，在集群中用于识别服务器对应的节点。节点可以通过指定集群名字来加入到集群中。默认情况，每个节点被设置成加入到elasticsearch集群。如果启动了多个节点，假设能自动发现对方，他们将会自动组建一个名为elasticsearch的集群。
index（索引）：一个索引就是一个拥有几分相似特征的文档的集合。比如说，你可以有一个客户数据的索引，另一个产品目录的索引，还有一个订单数据的索引。一个索引由一个名字来标识（必须全部是小写字母的），并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候，都要使用到这个名字。在一个集群中，如果你想，可以定义任意多的索引。
type（类型）：在一个索引中，你可以定义一种或多种类型。一个类型是你的索引的一个逻辑上的分类/分区，其语义完全由你来定。通常，会为具有一组共同字段的文档定义一个类型。比如说，我们假设你运营一个博客平台并且将你所有的数据存储到一个索引中。
在这个索引中，你可以为用户数据定义一个类型，为博客数据定义另一个类型，当然，也可以为评论数据定义另一个类型。
document（文档）:一个文档是一个可被索引的基础信息单元。比如，你可以拥有某一个客户的文档，某一个产品的一个文档，当然，也可以拥有某个订单的一个文档。文档以JSON（Javascript Object Notation）格式来表示，而JSON是一个到处存在的互联网数据交互格式。在一个index/type里面，只要你想，你可以存储任意多的文档。注意，虽然一个文档在物理上位于一个索引中，实际上一个文档必须在一个索引内被索引和分配一个类型。
shards（分片）:在实际情况下，索引存储的数据可能超过单个节点的硬件限制。如一个10亿文档需1TB空间可能不适合存储在单个节点的磁盘上，或者从单个节点搜索请求太慢了。为了解决这个问题，elasticsearch提供将索引分成多个分片的功能。当在创建索引时，可以定义想要分片的数量。每一个分片就是一个全功能的独立的索引，可以位于集群中任何节点上。分片的好处在于水平分割扩展，增大存储量；分布式并行跨分片操作，提高性能和吞吐量
replicas（副本）：分布式分片的机制和搜索请求的文档如何汇总完全是有elasticsearch控制的，这些对用户而言是透明的。
网络问题等等其它问题可以在任何时候不期而至，为了健壮性，强烈建议要有一个故障切换机制，无论何种故障以防止分片或者节点不可用。为此，elasticsearch让我们将索引分片复制一份或多份，称之为分片副本或副本。副本的好处在于高可用性，高性能