为什么用到ELK:
一般我们需要进行日志分析场景:直接在日志文件中 grep、awk 就可以获得自己想要的信息。但在规模较大的场景中,此方法效率低下,面临问题包括日志量太大如何归档、文本搜索太慢怎么办、如何多维度查询。需要集中化的日志管理,所有服务器上的日志收集汇总。常见解决思路是建立集中式日志收集系统,将所有节点上的日志统一收集,管理,访问。
一般大型系统是一个分布式部署的架构,不同的服务模块部署在不同的服务器上,问题出现时,大部分情况需要根据问题暴露的关键信息,定位到具体的服务器和服务模块,构建一套集中式日志系统,可以提高定位问题的效率。
一个完整的集中式日志系统,需要包含以下几个主要特点:
- 收集-能够采集多种来源的日志数据
- 传输-能够稳定的把日志数据传输到中央系统
- 存储-如何存储日志数据
- 分析-可以支持 UI 分析
- 警告-能够提供错误报告,监控机制
ELK提供了一整套解决方案,并且都是开源软件,之间互相配合使用,完美衔接,高效的满足了很多场合的应用。目前主流的一种日志系统。
ELK简介:
ELK是三个开源软件的缩写,分别表示:Elasticsearch , Logstash, Kibana , 它们都是开源软件。新增了一个FileBeat,它是一个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器上搜集日志后传输给Logstash,官方也推荐此工具。
- Elasticsearch是个开源分布式搜索引擎,提供搜集、分析、存储数据三大功能。它的特点有:分布式,零配置,自动发现,索引自动分片,索引副本机制,restful风格接口,多数据源,自动搜索负载等。
- Logstash 主要是用来日志的搜集、分析、过滤日志的工具,支持大量的数据获取方式。一般工作方式为c/s架构,client端安装在需要收集日志的主机上,server端负责将收到的各节点日志进行过滤、修改等操作在一并发往elasticsearch上去。
- Kibana 也是一个开源和免费的工具,Kibana可以为 Logstash 和 ElasticSearch 提供的日志分析友好的 Web 界面,可以帮助汇总、分析和搜索重要数据日志。
一、elasticsearch安装部署
编辑配置文件
但此时启动服务是失败的,提示需要java环境
安装java环境
重新启动服务成功
安装java环境后,启动需要解决日志报错,在/etc/security/limits.conf解除限制条件
vim /etc/security/limits.conf
在浏览器中查看
安装head 插件,它是一个用浏览器跟 ES 集群交互的插件,可以查看集群状态、集群的 doc 内容、执行搜索和普通的 Rest 请求。
在另外两台机器server2、server3同样安装elasticsearch和jave环境,并在三台机器做好本地解析
server2:(server3也一样)
完成后重启服务,再次访问,由黄色变成绿色,绿色表示正常,分布式存储如图
配置让servre1只做管理节点,不做数据节点
server2和server3上:
完成后重启服务,在浏览器中查看:
可能出现的报错:
解决方法:将ES_HEAP_SIZE设置为内存的一半(我的内存为1024)
调API的操作,这里只使用了GET和DELETE如果感兴趣,可以根据官方文档继续深入
curl -XDELETE 'http://localhost:9200/index/'
二、Logstash安装部署
测试:
在浏览器中查看
以配置文件的形式完成上述功能
logstash事件处理有三个阶段:inputs---->filters ---->outputs.是一个接收,处理,转发日志的工具。支持系统日志,webserver日志,错误日志,总之包括所有可以抛出来的日志
在浏览器中:
继续编辑es.conf文件,将日志信息输出至文件
查看:
再次编辑.conf文件,显示日志信息
start_opsition:选择Logstash最初读取文件的位置:开始或结束。默认行为将文件视为实况流,因此在末尾开始。如果有要导入的旧数据,请将其设置为开始。此选项仅修改“第一次接触”情况,其中文件是新的,以前没有看到,即没有记录在由Logstash读取的sincedb文件中的当前位置的文件。如果以前已经看到过文件,则此选项无效,将使用sincedb文件中记录的位置。要想重新开始存储,删除sincedb文件才可以重新读取
将多行事件变成一行
测试一:
测试二:
按我们的想法处理数据,格式化数据,过滤数据这里做APACHE的数据过滤,显示我们想要的内容
Grok用于将非结构化日志数据解析为结构化和可查询的内容。该工具非常适合于syslog日志、apache和其他web服务器日志、mysql日志,以及一般情况下任何为人类编写的日志格式,而不适合于计算机使用。
我们也可以直接导入模版
nginx日志过滤
三、Kibana的安装部署
在浏览器中查看:
可以自己选择相应的字段进行显示