Logstash笔记

最新推荐文章于 2023-08-19 13:48:22 发布

辛聪明

最新推荐文章于 2023-08-19 13:48:22 发布

阅读量218

点赞数

分类专栏： ELK 文章标签： Logstash

本文链接：https://blog.csdn.net/qq_41861558/article/details/102975218

版权

ELK 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、概念

Elasticsearch是当前主流的分布式大数据存储和搜索引擎，可以为用户提供强大的全文本检索能力，广泛应用于日志检索，全站搜索等领域。Logstash作为Elasicsearch常用的实时数据采集引擎，可以采集来自不同数据源的数据，并对数据进行处理后输出到多种输出源，是Elastic Stack 的重要组成部分。

Logstash的数据处理过程主要包括：Inputs, Filters, Outputs 三部分，另外在Inputs和Outputs中可以使用Codecs对数据格式进行处理。这四个部分均以插件形式存在，用户通过定义pipeline配置文件，设置需要使用的input，filter，output, codec插件，以实现特定的数据采集，数据处理，数据输出等功能

Inputs：用于从数据源获取数据，常见的插件如file, syslog, redis, beats 等

Filters：用于处理数据如格式转换，数据派生等，常见的插件如grok, mutate, drop, clone, geoip等

Outputs：用于数据输出，常见的插件如elastcisearch，file, graphite, statsd等

Codecs：Codecs不是一个单独的流程，而是在输入和输出等插件中用于数据转换的模块，用于对数据进行编码处理，常见的插件如json，multiline

（1）每个Input启动一个线程，从对应数据源获取数据
（2）Input会将数据写入一个队列：默认为内存中的有界队列（意外停止会导致数据丢失）。为了防止数丢失Logstash提供了两个特性： Persistent Queues：通过磁盘上的queue来防止数据丢失 Dead Letter Queues：保存无法处理的event（仅支持Elasticsearch作为输出源）
（3）Logstash会有多个pipeline worker, 每一个pipeline worker会从队列中取一批数据，然后执行filter和output（worker数目及每次处理的数据量均由配置确定）

二、采集日志

1、控制台输入及控制台输出

[root@hdp-1 bin]# ./logstash -e input {stdin} putput {stdout}

2、启动logstash以文件作配置

 bin/logstash -f console.conf

3、监测文件输出到控制台

input {
    file{
        path => "/root/apps/logstash-5.6.16/data.txt"
    }
 }
output {
     stdout {}
 }

4、采集控制台消息输出到es

input { 
	file{
        path => "/root/apps/logstash-5.6.16/testFile.txt"
    }
 }
output {
  elasticsearch { hosts => ["hdp-4:9200"] }
  stdout { codec => rubydebug }
}

辛聪明

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Logstash笔记

一、概念Elasticsearch是当前主流的分布式大数据存储和搜索引擎，可以为用户提供强大的全文本检索能力，广泛应用于日志检索，全站搜索等领域。Logstash作为Elasicsearch常用的实时数据采集引擎，可以采集来自不同数据源的数据，并对数据进行处理后输出到多种输出源，是Elastic Stack 的重要组成部分。Logstash的数据处理过程主要包括：Inputs, Fil...
复制链接

扫一扫