elk是如何搭建的
ELK组成
elk由elasticsearch,logstash,kibana组件组成
ELK如何工作
Logstash收集AppServer产生的Log,并存放到ElasticSearch集群中,而Kibana则从ES集群中查询数据生成图表,再返回给Browser
一共四个步骤:
- 将日志收集并惊醒集中化管理(beats),其中beats包含四种工具
Packetbeat(搜集网络流量数据)
Topbeat(搜集系统、进程和文件系统级别的 CPU 和内存使用情况等数据)
Filebeat(搜集文件数据)轻量级的工具(相较于logstash)
Winlogbeat(搜集 Windows 事件日志数据) - 将收集的日志格式化(logstash)
- 对格式化后的数据进行索引和存储(elasticsearch)
- 前端数据的展示(kibana)
ELK三种组件介绍
elasticsearch介绍
它提供了一个分布式多用户能力的全文搜索引擎,Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是第二流行的企业搜索引擎。用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
Elasticsearch的基础核心概念
- 接近实时(NRT)
elasticsearch是一个接近实时的搜索平台,这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒) - 集群(cluster)
一个集群就是由一个或多个节点组织在一起,它们共同持有整个的数据,并一起提供索引和搜索功能(共享数据)。其中一个节点为主节点,这个主节点是可以通过选举产生的,并提供跨节点的联合索引和搜索的功能。集群有一个唯一性标示的名字,默认是elasticsearch,es 具有集群机制,节点通过集群名称加入到集群中,同时在集群中的节点会有一个自己的唯一身份标识 - 节点(node)
节点就是一台单一的服务器,是集群的一部分,存储数据并参与集群的索引和搜索功能。节点也是通过名字来标识,默认是在节点启动时随机分配的字符名,节点可以通过指定集群名字来加入到集群中,如果启动了多个节点,假设能自动发现对方,他们将会自动组建一个名为elasticsearch的集群。 - 索引(index)
一个索引就是一个拥有几分相似特征的文档的集合。一个索引由一个名字来标识(必须全部是小写字母的),并且当我们要对对应于这个索引中的文档进行索引、搜索、更新和删除的时候,都要使用到这个名字。索引相对于关系型数据库的库。 - 类型(type)
在一个索引中,你可以定义一种或多种类型。类型相对于关系型数据库的表 - 文档(document)
一个文档是一个可被索引的基础信息单元。在一个index/type里面,只要你想,你可以存储任意多的文档。文档相对于关系型数据库的列。 - 分片和副本(shards & replicas)
在实际情况下,索引存储的数据可能超过单个节点的硬件限制。从单个节点搜索请求太慢了。为了解决这个问题,elasticsearch提供将索引分成多个分片的功能。当在创建索引时,可以定义想要分片的数量。
– 分片的主要原因:水平分割扩展,增大存储量 ;分布式并行跨分片操作,提高性能和吞吐量
为了不发生故障,elasticsearch将索引分片复制一份或多份,称之为分片副本或副本
– 副本的主要原因:高可用性,以应对分片或者节点故障。出于这个原因,分片副本要在不同的节点上; qps性能,增大吞吐量,搜索可以并行在所有副本上执行。
每个索引可以被分成多个分片。一个索引也可以被复制0次或多次。一旦复制了,每个索引就有了主分片(作为复制源的原来的分片)和复制分片(主分片的拷贝)之别。
– 默认情况下,Elasticsearch中的每个索引被分片5个主分片和1个副本,这意味着,如果你的集群中至少有两个节点,你的索引将会有5个主分片
和另外5个副本分片(1个完全拷贝),这样的话每个索引总共就有10个分片
logstash介绍
Logstash由JRuby语言编写,基于消息(message-based)的简单架构,并运行在Java虚拟机(JVM)上
- Logstash做3件事:
Collect:数据输入
Enrich:数据加工,如过滤,改写等
Transport:数据输出(被其他模块进行调用)
logStash的主要组件:
- Shipper日志收集者:负责监控本地日志文件的变化,及时把日志文件的最新内容收集起来。
- Indexer日志存储者:负责接收日志并写入到本地文件。
- Broker日志Hub:负责连接多个Shipper和多个Indexer
- Search and Storage:允许对事件进行搜索和存储
- Web Interface:基于Web的展示界面
LogStash主机分类
- 代理主机(agent host):作为事件的传递者(shipper),将各种日志数据发送至中心主机,只需运行Logstash 代理(agent)程序
- 中心主机(central host):可运行包括中间转发器(Broker)、索引器(Indexer)、搜索和存储器(Search and Storage)、Web界面端(Web Interface)在内的各个组件,以实现对日志数据的接收、处理和存储
Kibana介绍
Kibana是一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana,可以通过各种图表进行高级数据分析及展示。
kibana主要功能
- Elasticsearch无缝之集成。Kibana架构为Elasticsearch定制,可以将任何结构化和非结构化数据加入Elasticsearch索引。Kibana还充分利用了Elasticsearch强大的搜索和分析功能。
- 整合数据。Kibana能够更好地处理海量数据,并据此创建柱形图、折线图、散点图、直方图、饼图和地图。
- 复杂数据分析。Kibana提升了Elasticsearch分析能力,能够更加智能地分析数据,执行数学转换并且根据要求对数据切割分块。
- 让更多团队成员受益。强大的数据库可视化接口让各业务岗位都能够从数据集合受益。
- 接口灵活,分享更容易。使用Kibana可以更加方便地创建、保存、分享数据,并将可视化数据快速交流。
- 配置简单。Kibana的配置和启用非常简单,用户体验非常友好。Kibana自带Web服务器,可以快速启动运行
- 可视化多数据源。Kibana可以非常方便地把来自Logstash、ES-Hadoop、Beats或第三方技术的数据整合到Elasticsearch,支持的第三方技术包括Apache Flume、Fluentd
- 简单数据导出。Kibana可以方便地导出感兴趣的数据,与其它数据集合并融合后快速建模分析,直观的发现新结果。
部署ELK日志分析系统
- 实验环境
服务器 Centos7.4 node1 192.168.1.101 Elasticsearch Kibana
服务器 Centos7.4 node2 192.168.1.3 Elasticsearch
服务器 Centos7.4 apache 192.168.1.4 Logstash Apache
配置elasticsearch环境
- 在node1上先配置映射
[root@node1 ~]# vim /etc/hosts
192.168.1.101 node1
192.168.1.3 node2
192.168.1.4 httpd
- 然后安装JDK环境
[root@node1 ~]# tar zxf jdk-8u91-linux-x64.tar.gz -C /usr/local/
[root@node1 ~]# vim /etc/profile
export JAVA_HOME=/usr/local/jdk1.8.0_91
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
source /etc/profile
- 在node2上添加映射
[root@node2 ~]# vim /etc/hosts
192.168.1.101 node1
192.168.1.3 node2
192.168.1.4 httpd
部署elasticsearch软件
- 在node1上安装elasticsearch-5.5.0.rpm
[root@node1 opt]# rpm -ivh elasticsearch-5.5.0.rpm
- 加载系统服务
[root@node1 opt]# systemctl daemon-reload
[root@node1 opt]# systemctl enable elasticsearch.service
Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service.
[root@node1 opt]#
- 更改elasticsearch配置
[root@node1 opt]# cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
[root@node1 opt]# vim /etc/elasticsearch/elasticsearch.yml
17 cluster.name: my-elk-cluster //修改集群名字
23 node.name: node1 //节点名字
33 path.data: /data/elk_data //数据存放路径
37 path.logs: /var/log/elasticsearch/ //日志存放路径
43 bootstrap.memory_lock: false //不在启动的时候锁定内存
55 network.host: 0.0.0.0 //提供服务绑定的IP地址,0.0.0.0代表所有地址
59 http.port: 9200 //侦听端口为9200
68 discovery.zen.ping.unicast.hosts: ["node1", "node2"] //集群发现通过单播实现
- 创建数据存放路径并授权
[root@node1 opt]# mkdir -p /data/elk_data
[root@node1 opt]# chown elasticsearch:elasticsearch /data/elk_data/
- 启动elasticsearch是否成功开启
[root@node1 opt]# systemctl start elasticsearch.service
[root@node1 opt]# netstat -antp | grep 9200
tcp6 0 0 :::9200 :::* LISTEN 13578/java
- 如果缓存过大可以先清除缓存
[root@node1 opt]# echo 3 > /proc/sys/vm/drop_caches
[root@node1 opt]# free -h
total used free shared buff/cache available
Mem: 5.7G 2.9G 2.6G 21M 252M 2.5G
- 查看节点信息
- 在node2上安装elasticsearch-5.5.0.rpm
[root@node2 opt]# rpm -ivh elasticsearch-5.5.0.rpm
- 加载系统服务
[root@node2 opt]# systemctl daemon-reload
[root@node2 opt]# systemctl enable elasticsearch.service
Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service.
[root@node2 opt]#
- 更改elasticsearch主配置文件
[root@node2 opt]# cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak
[root@node2 opt]# vim /etc/elasticsearch/elasticsearch.yml
17 cluster.name: my-elk-cluster //修改集群名字
23 node.name: node2 //节点名字
33 path.data: /data/elk_data //数据存放路径
37 path.logs: /var/log/elasticsearch/ //日志存放路径
43 bootstrap.memory_lock: false //不在启动的时候锁定内存
55 network.host: 0.0.0.0 //提供服务绑定的IP地址,0.0.0.0代表所有地址
59 http.port: 9200 //侦听端口为9200
68 discovery.zen.ping.unicast.hosts: ["node1", "node2"] //集群发现通过单播实现
- 创建数据存放路径并授权
[root@node2 opt]# mkdir -p /data/elk_data
[root@node2 opt]# chown elasticsearch:elasticsearch /data/elk_data/
- 启动elasticsearch是否成功开启
[root@node2 opt]# systemctl start elasticsearch.service
[root@node2 opt]# netstat -antp |grep 9200
tcp6 0 0 :::9200 :::* LISTEN 24125/java
- 在真机上查看节点信息
- 查看集群健康情况
- 查看集群状态
安装elasticsearch-head插件
我们可以通过安装elasticsearch-head插件后,来管理集群
- 在node1上安装node组件及依赖包
[root@node1 opt]# tar zxf node-v8.2.1.tar.gz
[root@node1 opt]# cd node-v8.2.1/
[root@node1 node-v8.2.1]# yum install gcc gcc-c++ make -y
[root@node1 node-v8.2.1]# ./configure
[root@node1 node-v8.2.1]# make -j3
[root@node1 node-v8.2.1]# make install
- 安装phantomjs前端框架
[root@node1 opt]# tar xjf phantomjs-2.1.1-linux-x86_64.tar.bz2
[root@node1 opt]# cd phantomjs-2.1.1-linux-x86_64/
[root@node1 phantomjs-2.1.1-linux-x86_64]# ls
bin ChangeLog examples LICENSE.BSD README.md third-party.txt
[root@node1 phantomjs-2.1.1-linux-x86_64]# cd bin/
[root@node1 bin]# ls
phantomjs
[root@node1 bin]# cp phantomjs /usr/local/bin/
- 安装elasticsearch-head数据可视化工具
[root@node1 elasticsearch-head]# pwd
/usr/local/src/elasticsearch-head
[root@node1 elasticsearch-head]# npm install
- 修改主配置文件
[root@node1 ~]# vim /etc/elasticsearch/elasticsearch.yml
http.cors.enabled: true //开启跨域访问支持,默认为false
http.cors.allow-origin: "*" //跨域访问允许的域名地址
[root@node1 ~]# systemctl restart elasticsearch.service
- 启动elasticsearch-head
[root@node1 ~]# cd /usr/local/src/elasticsearch-head/
[root@node1 elasticsearch-head]# npm run start &
[1] 59756
[root@node1 elasticsearch-head]#
> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server
Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100
- node2做同样操作
[root@node2 elasticsearch-head]# npm run start &
[1] 118386
[root@node2 elasticsearch-head]#
> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server
Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100
[root@node2 elasticsearch-head]# netstat -lnupt |grep 9100
tcp 0 0 0.0.0.0:9100 0.0.0.0:* LISTEN 118396/grunt
[root@node2 elasticsearch-head]# netstat -lnupt |grep 9200
tcp6 0 0 :::9200 :::* LISTEN 118269/java
- 然后在网页上查看
- 在命令行创建索引
[root@node1 elasticsearch-head]# curl -XPUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'
{
"_index" : "index-demo",
"_type" : "test",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"created" : true
}
- 在web上查看索引
安装logstash并做一些日志搜集输出到elasticsearch中
- 安装apache并启动
[root@apache ~]# yum -y install httpd
[root@apache ~]# systemctl start httpd
tcp6 0 0 :::80 :::* LISTEN 21581/httpd
[root@apache ~]# java -version //查看jdk版本
openjdk version "1.8.0_181"
OpenJDK Runtime Environment (build 1.8.0_181-b13)
OpenJDK 64-Bit Server VM (build 25.181-b13, mixed mode)
- 安装logstash
[root@apache ~]# cd /opt
[root@apache opt]# rpm -ivh logstash-5.5.1.rpm //安装logstash
[root@apache opt]# systemctl start logstash.service //启动logstash
[root@apache opt]# systemctl enable logstash.service
[root@apache opt]# ln -s /usr/share/logstash/bin/logstash /usr/local/bin/ //建立logstash软连接
-
logstash(Apache)与elasticsearch(node)功能是否正常,做对接测试
-f 通过这个选项可以指定logstash的配置文件,根据配置文件配置logstash
-e 后面跟着字符串 该字符串可以被当做logstash的配置(如果是” ”,则默认使用stdin做为输入、stdout作为输出)
-t 测试配置文件是否正确,然后退出 -
输入采用标准输入 输出采用标准输出
[root@apache ~]# logstash -e 'input { stdin{} } output { stdout{} }'
The stdin plugin is now waiting for input:
08:58:38.416 [[main]-pipeline-manager] INFO logstash.pipeline - Pipeline main started
08:58:38.728 [Api Webserver] INFO logstash.agent - Successfully started Logstash API endpoint {:port=>9600}
www.baidu.com
2021-08-15T22:59:03.780Z apache www.baidu.com
- 使用rubydebug显示详细输出,codec为一种编解码器
[root@apache ~]# logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'
www.baidu.com
{
"@timestamp" => 2021-08-15T22:59:55.862Z,
"@version" => "1",
"host" => "apache",
"message" => "www.baidu.com"
}
- 使用logstash将信息写入elasticsearch中
[root@apache ~]# logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.1.101:9200"] } }'
- 然后在web页面上查看logstash-20121.08.15就是生成的日志
在apache上做对接配置
修改日志权限
[root@apache ~]# chmod o+r /var/log/messages
[root@apache ~]# ll /var/log/messages
-rw----r--. 1 root root 199814 8月 16 09:25 /var/log/messages
- 配置文件中定义的是收集系统日志
[root@apache ~]# vim /etc/logstash/conf.d/system.conf
input {
file{
path => "/var/log/messages"
type => "system"
start_position => "beginning"
}
}
output {
elasticsearch {
hosts => ["192.168.1.101:9200"]
index => "system-%{+YYYY.MM.dd}"
}
}
安装kibana
- 在node1上安装kibana
[root@node1 opt]# cd /usr/local/src/
[root@node1 src]# ls
elasticsearch-head kibana-5.5.1-x86_64.rpm
[root@node1 src]# rpm -ivh kibana-5.5.1-x86_64.rpm
警告:kibana-5.5.1-x86_64.rpm: 头V4 RSA/SHA512 Signature, 密钥 ID d88e42b4: NOKEY
准备中... ################################# [100%]
正在升级/安装...
1:kibana-5.5.1-1 ################################# [100%]
- 修改kibana配置
[root@node1 kibana]# vim kibana.yml
2/ server.port: 5601 //kibana打开的端口
7/ server.host: "0.0.0.0" //kibana侦听的地址
21/ elasticsearch.url: "http://192.168.1.101:9200" //和elasticsearch建立联系
30/ kibana.index: ".kibana" //在elasticsearch中添加.kibana索引
- 启动kibana
[root@node1 kibana]# systemctl start kibana.service
[root@node1 kibana]# systemctl enable kibana.service
Created symlink from /etc/systemd/system/multi-user.target.wants/kibana.service to /etc/systemd/system/kibana.service.
[root@node1 kibana]#
-
然后在真机上查看
-
对接Apache主机的Apache 日志文件(访问的、错误的)
[root@apache conf.d]# touch apache_log.conf
[root@apache conf.d]# vim apache_log.conf
input {
file{
path => "/etc/httpd/logs/access_log"
type => "access"
start_position => "beginning"
}
file{
path => "/etc/httpd/logs/error_log"
type => "error"
start_position => "beginning"
}
}
output {
if [type] == "access" {
elasticsearch {
hosts => ["192.168.1.101:9200"]
index => "apache_access-%{+YYYY.MM.dd}"
}
}
if [type] == "error" {
elasticsearch {
hosts => ["192.168.1.101:9200"]
index => "apache_error-%{+YYYY.MM.dd}"
}
}
}
- 查看web页面索引