elk是如何搭建的

最新推荐文章于 2024-07-22 15:43:33 发布

咸鱼王变身

最新推荐文章于 2024-07-22 15:43:33 发布

阅读量152

点赞数 1

文章标签： elk

本文链接：https://blog.csdn.net/qq_41257472/article/details/119719290

版权

elk是如何搭建的

ELK组成
ELK如何工作
ELK三种组件介绍
部署ELK日志分析系统

ELK组成

elk由elasticsearch，logstash，kibana组件组成

ELK如何工作

Logstash收集AppServer产生的Log，并存放到ElasticSearch集群中，而Kibana则从ES集群中查询数据生成图表，再返回给Browser
一共四个步骤：

将日志收集并惊醒集中化管理（beats），其中beats包含四种工具
Packetbeat（搜集网络流量数据）
Topbeat（搜集系统、进程和文件系统级别的 CPU 和内存使用情况等数据）
Filebeat（搜集文件数据）轻量级的工具（相较于logstash）
Winlogbeat（搜集 Windows 事件日志数据）
将收集的日志格式化（logstash）
对格式化后的数据进行索引和存储（elasticsearch）
前端数据的展示（kibana）

ELK三种组件介绍

elasticsearch介绍

它提供了一个分布式多用户能力的全文搜索引擎，Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是第二流行的企业搜索引擎。用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。

Elasticsearch的基础核心概念

接近实时（NRT）
elasticsearch是一个接近实时的搜索平台，这意味着，从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟（通常是1秒）
集群（cluster）
一个集群就是由一个或多个节点组织在一起，它们共同持有整个的数据，并一起提供索引和搜索功能（共享数据）。其中一个节点为主节点，这个主节点是可以通过选举产生的，并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字，默认是elasticsearch，es 具有集群机制，节点通过集群名称加入到集群中，同时在集群中的节点会有一个自己的唯一身份标识
节点（node）
节点就是一台单一的服务器，是集群的一部分，存储数据并参与集群的索引和搜索功能。节点也是通过名字来标识，默认是在节点启动时随机分配的字符名，节点可以通过指定集群名字来加入到集群中，如果启动了多个节点，假设能自动发现对方，他们将会自动组建一个名为elasticsearch的集群。
索引（index）
一个索引就是一个拥有几分相似特征的文档的集合。一个索引由一个名字来标识（必须全部是小写字母的），并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候，都要使用到这个名字。索引相对于关系型数据库的库。
类型（type）
在一个索引中，你可以定义一种或多种类型。类型相对于关系型数据库的表
文档（document）
一个文档是一个可被索引的基础信息单元。在一个index/type里面，只要你想，你可以存储任意多的文档。文档相对于关系型数据库的列。
分片和副本（shards & replicas）
在实际情况下，索引存储的数据可能超过单个节点的硬件限制。从单个节点搜索请求太慢了。为了解决这个问题，elasticsearch提供将索引分成多个分片的功能。当在创建索引时，可以定义想要分片的数量。

– 分片的主要原因：水平分割扩展，增大存储量；分布式并行跨分片操作，提高性能和吞吐量
为了不发生故障，elasticsearch将索引分片复制一份或多份，称之为分片副本或副本

– 副本的主要原因：高可用性，以应对分片或者节点故障。出于这个原因，分片副本要在不同的节点上； qps性能，增大吞吐量，搜索可以并行在所有副本上执行。
每个索引可以被分成多个分片。一个索引也可以被复制0次或多次。一旦复制了，每个索引就有了主分片（作为复制源的原来的分片）和复制分片（主分片的拷贝）之别。

– 默认情况下，Elasticsearch中的每个索引被分片5个主分片和1个副本，这意味着，如果你的集群中至少有两个节点，你的索引将会有5个主分片
和另外5个副本分片（1个完全拷贝），这样的话每个索引总共就有10个分片

logstash介绍

Logstash由JRuby语言编写，基于消息（message-based）的简单架构，并运行在Java虚拟机（JVM）上

Logstash做3件事：
Collect：数据输入
Enrich：数据加工，如过滤，改写等
Transport：数据输出（被其他模块进行调用）

logStash的主要组件:

Shipper日志收集者：负责监控本地日志文件的变化，及时把日志文件的最新内容收集起来。
Indexer日志存储者：负责接收日志并写入到本地文件。
Broker日志Hub：负责连接多个Shipper和多个Indexer
Search and Storage：允许对事件进行搜索和存储
Web Interface：基于Web的展示界面

LogStash主机分类

代理主机（agent host）：作为事件的传递者（shipper），将各种日志数据发送至中心主机，只需运行Logstash 代理（agent）程序
中心主机（central host）：可运行包括中间转发器（Broker）、索引器（Indexer）、搜索和存储器（Search and Storage）、Web界面端（Web Interface）在内的各个组件，以实现对日志数据的接收、处理和存储

Kibana介绍

Kibana是一个针对Elasticsearch的开源分析及可视化平台，用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana，可以通过各种图表进行高级数据分析及展示。

kibana主要功能

Elasticsearch无缝之集成。Kibana架构为Elasticsearch定制，可以将任何结构化和非结构化数据加入Elasticsearch索引。Kibana还充分利用了Elasticsearch强大的搜索和分析功能。
整合数据。Kibana能够更好地处理海量数据，并据此创建柱形图、折线图、散点图、直方图、饼图和地图。
复杂数据分析。Kibana提升了Elasticsearch分析能力，能够更加智能地分析数据，执行数学转换并且根据要求对数据切割分块。
让更多团队成员受益。强大的数据库可视化接口让各业务岗位都能够从数据集合受益。
接口灵活，分享更容易。使用Kibana可以更加方便地创建、保存、分享数据，并将可视化数据快速交流。
配置简单。Kibana的配置和启用非常简单，用户体验非常友好。Kibana自带Web服务器，可以快速启动运行
可视化多数据源。Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch，支持的第三方技术包括Apache Flume、Fluentd
简单数据导出。Kibana可以方便地导出感兴趣的数据，与其它数据集合并融合后快速建模分析，直观的发现新结果。

部署ELK日志分析系统

实验环境
服务器 Centos7.4 node1 192.168.1.101 Elasticsearch Kibana
服务器 Centos7.4 node2 192.168.1.3 Elasticsearch
服务器 Centos7.4 apache 192.168.1.4 Logstash Apache

配置elasticsearch环境

在node1上先配置映射

[root@node1 ~]# vim /etc/hosts
192.168.1.101 node1
192.168.1.3 node2
192.168.1.4 httpd

然后安装JDK环境

[root@node1 ~]# tar zxf jdk-8u91-linux-x64.tar.gz -C /usr/local/
[root@node1 ~]# vim /etc/profile
export JAVA_HOME=/usr/local/jdk1.8.0_91
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
source /etc/profile

在node2上添加映射

[root@node2 ~]# vim /etc/hosts
192.168.1.101 node1
192.168.1.3 node2
192.168.1.4 httpd

部署elasticsearch软件

在node1上安装elasticsearch-5.5.0.rpm

[root@node1 opt]# rpm -ivh elasticsearch-5.5.0.rpm

加载系统服务

[root@node1 opt]# systemctl daemon-reload 
[root@node1 opt]# systemctl enable elasticsearch.service 
Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service.
[root@node1 opt]#

更改elasticsearch配置

[root@node1 opt]# cp /etc/elasticsearch/elasticsearch.yml  /etc/elasticsearch/elasticsearch.yml.bak
[root@node1 opt]# vim /etc/elasticsearch/elasticsearch.yml
 17 cluster.name: my-elk-cluster		//修改集群名字
 23 node.name: node1					//节点名字
33 path.data: /data/elk_data			//数据存放路径
37 path.logs: /var/log/elasticsearch/	//日志存放路径
 43 bootstrap.memory_lock: false		//不在启动的时候锁定内存
 55 network.host: 0.0.0.0				//提供服务绑定的IP地址，0.0.0.0代表所有地址
59 http.port: 9200						//侦听端口为9200
 68 discovery.zen.ping.unicast.hosts: ["node1", "node2"]	//集群发现通过单播实现

创建数据存放路径并授权

[root@node1 opt]# mkdir -p /data/elk_data
[root@node1 opt]# chown elasticsearch:elasticsearch /data/elk_data/

启动elasticsearch是否成功开启

[root@node1 opt]# systemctl start elasticsearch.service 
[root@node1 opt]# netstat -antp | grep 9200
tcp6       0      0 :::9200                 :::*                    LISTEN      13578/java

如果缓存过大可以先清除缓存

[root@node1 opt]# echo 3 > /proc/sys/vm/drop_caches 
[root@node1 opt]# free -h
              total        used        free      shared  buff/cache   available
Mem:           5.7G        2.9G        2.6G         21M        252M        2.5G

查看节点信息
在node2上安装elasticsearch-5.5.0.rpm

[root@node2 opt]# rpm -ivh elasticsearch-5.5.0.rpm

加载系统服务

[root@node2 opt]# systemctl daemon-reload 
[root@node2 opt]# systemctl enable elasticsearch.service 
Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service.
[root@node2 opt]#

更改elasticsearch主配置文件

[root@node2 opt]# cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
[root@node2 opt]# vim /etc/elasticsearch/elasticsearch.yml
 17 cluster.name: my-elk-cluster		//修改集群名字
 23 node.name: node2					//节点名字
33 path.data: /data/elk_data			//数据存放路径
37 path.logs: /var/log/elasticsearch/	//日志存放路径
 43 bootstrap.memory_lock: false		//不在启动的时候锁定内存
 55 network.host: 0.0.0.0				//提供服务绑定的IP地址，0.0.0.0代表所有地址
59 http.port: 9200						//侦听端口为9200
 68 discovery.zen.ping.unicast.hosts: ["node1", "node2"]	//集群发现通过单播实现

创建数据存放路径并授权

[root@node2 opt]# mkdir -p /data/elk_data
[root@node2 opt]# chown elasticsearch:elasticsearch /data/elk_data/

启动elasticsearch是否成功开启

[root@node2 opt]# systemctl start elasticsearch.service
[root@node2 opt]# netstat -antp |grep 9200
tcp6       0      0 :::9200                 :::*                    LISTEN      24125/java

在真机上查看节点信息
查看集群健康情况
查看集群状态

安装elasticsearch-head插件

我们可以通过安装elasticsearch-head插件后，来管理集群

在node1上安装node组件及依赖包

[root@node1 opt]# tar zxf node-v8.2.1.tar.gz 
[root@node1 opt]# cd node-v8.2.1/
[root@node1 node-v8.2.1]# yum install gcc gcc-c++ make -y
[root@node1 node-v8.2.1]# ./configure 
[root@node1 node-v8.2.1]# make -j3
[root@node1 node-v8.2.1]# make install

安装phantomjs前端框架

[root@node1 opt]# tar xjf phantomjs-2.1.1-linux-x86_64.tar.bz2 
[root@node1 opt]# cd phantomjs-2.1.1-linux-x86_64/
[root@node1 phantomjs-2.1.1-linux-x86_64]# ls
bin  ChangeLog  examples  LICENSE.BSD  README.md  third-party.txt
[root@node1 phantomjs-2.1.1-linux-x86_64]# cd bin/
[root@node1 bin]# ls
phantomjs
[root@node1 bin]# cp phantomjs /usr/local/bin/

安装elasticsearch-head数据可视化工具

[root@node1 elasticsearch-head]# pwd
/usr/local/src/elasticsearch-head
[root@node1 elasticsearch-head]# npm install

修改主配置文件

[root@node1 ~]# vim /etc/elasticsearch/elasticsearch.yml
http.cors.enabled: true  //开启跨域访问支持，默认为false
http.cors.allow-origin: "*" //跨域访问允许的域名地址
[root@node1 ~]# systemctl restart elasticsearch.service

启动elasticsearch-head

[root@node1 ~]# cd /usr/local/src/elasticsearch-head/
[root@node1 elasticsearch-head]# npm run start &
[1] 59756
[root@node1 elasticsearch-head]# 
> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

node2做同样操作

[root@node2 elasticsearch-head]# npm run start &
[1] 118386
[root@node2 elasticsearch-head]# 
> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

[root@node2 elasticsearch-head]# netstat -lnupt |grep 9100
tcp        0      0 0.0.0.0:9100            0.0.0.0:*               LISTEN      118396/grunt        
[root@node2 elasticsearch-head]# netstat -lnupt |grep 9200
tcp6       0      0 :::9200                 :::*                    LISTEN      118269/java

然后在网页上查看

在这里插入图片描述

在命令行创建索引

[root@node1 elasticsearch-head]# curl -XPUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'
{
  "_index" : "index-demo",
  "_type" : "test",
  "_id" : "1",
  "_version" : 1,
  "result" : "created",
  "_shards" : {
    "total" : 2,
    "successful" : 2,
    "failed" : 0
  },
  "created" : true
}

在web上查看索引

安装logstash并做一些日志搜集输出到elasticsearch中

安装apache并启动

[root@apache ~]# yum -y install httpd
[root@apache ~]# systemctl start httpd
tcp6       0      0 :::80                   :::*                    LISTEN      21581/httpd         
[root@apache ~]# java -version			//查看jdk版本
openjdk version "1.8.0_181"
OpenJDK Runtime Environment (build 1.8.0_181-b13)
OpenJDK 64-Bit Server VM (build 25.181-b13, mixed mode)

安装logstash

[root@apache ~]# cd /opt
[root@apache opt]# rpm -ivh logstash-5.5.1.rpm              //安装logstash
[root@apache opt]# systemctl start logstash.service         //启动logstash
[root@apache opt]# systemctl enable logstash.service
[root@apache opt]# ln -s /usr/share/logstash/bin/logstash /usr/local/bin/    //建立logstash软连接

logstash（Apache）与elasticsearch（node）功能是否正常，做对接测试
-f 通过这个选项可以指定logstash的配置文件，根据配置文件配置logstash
-e 后面跟着字符串该字符串可以被当做logstash的配置（如果是” ”,则默认使用stdin做为输入、stdout作为输出）
-t 测试配置文件是否正确，然后退出
输入采用标准输入输出采用标准输出

[root@apache ~]# logstash -e 'input { stdin{} } output { stdout{} }'
The stdin plugin is now waiting for input:
08:58:38.416 [[main]-pipeline-manager] INFO  logstash.pipeline - Pipeline main started
08:58:38.728 [Api Webserver] INFO  logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
www.baidu.com
2021-08-15T22:59:03.780Z apache www.baidu.com

使用rubydebug显示详细输出，codec为一种编解码器

[root@apache ~]# logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'
www.baidu.com
{
    "@timestamp" => 2021-08-15T22:59:55.862Z,
      "@version" => "1",
          "host" => "apache",
       "message" => "www.baidu.com"
}

使用logstash将信息写入elasticsearch中

[root@apache ~]# logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.1.101:9200"] } }'

然后在web页面上查看logstash-20121.08.15就是生成的日志

在apache上做对接配置

修改日志权限

[root@apache ~]# chmod o+r /var/log/messages
[root@apache ~]# ll /var/log/messages
-rw----r--. 1 root root 199814 8月  16 09:25 /var/log/messages

配置文件中定义的是收集系统日志

[root@apache ~]# vim /etc/logstash/conf.d/system.conf
input {
       file{
        path => "/var/log/messages"
        type => "system"
        start_position => "beginning"
        }
      }
output {
        elasticsearch {
          hosts => ["192.168.1.101:9200"]
          index => "system-%{+YYYY.MM.dd}"
          }
        }

在这里插入图片描述

安装kibana

在node1上安装kibana

[root@node1 opt]# cd /usr/local/src/
[root@node1 src]# ls
elasticsearch-head  kibana-5.5.1-x86_64.rpm
[root@node1 src]# rpm -ivh kibana-5.5.1-x86_64.rpm 
警告：kibana-5.5.1-x86_64.rpm: 头V4 RSA/SHA512 Signature, 密钥 ID d88e42b4: NOKEY
准备中...                          ################################# [100%]
正在升级/安装...
   1:kibana-5.5.1-1                   ################################# [100%]

修改kibana配置

[root@node1 kibana]# vim kibana.yml 
2/ server.port: 5601                //kibana打开的端口
7/ server.host: "0.0.0.0"          //kibana侦听的地址
21/ elasticsearch.url: "http://192.168.1.101:9200"            //和elasticsearch建立联系
30/ kibana.index: ".kibana"             //在elasticsearch中添加.kibana索引

启动kibana

[root@node1 kibana]# systemctl start kibana.service 
[root@node1 kibana]# systemctl enable kibana.service
Created symlink from /etc/systemd/system/multi-user.target.wants/kibana.service to /etc/systemd/system/kibana.service.
[root@node1 kibana]#

然后在真机上查看
对接Apache主机的Apache 日志文件（访问的、错误的）

[root@apache conf.d]# touch apache_log.conf
[root@apache conf.d]# vim apache_log.conf 
input {
       file{
        path => "/etc/httpd/logs/access_log"
        type => "access"
        start_position => "beginning"
        }
       file{
        path => "/etc/httpd/logs/error_log"
        type => "error"
        start_position => "beginning"
        } 
      }
output {
        if [type] == "access" {
        elasticsearch {
          hosts => ["192.168.1.101:9200"]
          index => "apache_access-%{+YYYY.MM.dd}"
          }
        }
        if [type] == "error" {
        elasticsearch {
          hosts => ["192.168.1.101:9200"]
          index => "apache_error-%{+YYYY.MM.dd}"
          }
        }
        }