05 Logstash安装与导入数据

Logstash安装与导入数据

下载最 MovieLens 最小测试数据集:https://grouplens.org/datasets/movielens/

Logstash 下载:https://www.elastic.co/cn/downloads/logstash

Logstash 参考文档:https://www.elastic.co/guide/en/logstash/current/index.html
Logstash 的作用就是一个数据收集器,将各种格式各种渠道的数据通过它收集解析之后格式化输出到 Elasticsearch

一.Logstash的安装

1.安装流程
  • 到官网下载压缩包并解压
  • 准备logstash.conf配置文件,执行bin/logstash -f logstash.conf启动
2.使用实例
  • 在grouplens下载数据集

  • 实例logstash.conf文件内容

    input {
      file {
        path => "实际的movies.csv路径:movies.csv"
        start_position => "beginning"
        sincedb_path => "/dev/null"
      }
    }
    
    # 对CSV进行处理部分
    filter {
      csv {
        separator => ","
        columns => ["id","content","genre"]
      }
    
      mutate {
        split => { "genre" => "|" }
        remove_field => ["path", "host","@timestamp","message"]
      }
    
      mutate {
    
        split => ["content", "("]
        add_field => { "title" => "%{[content][0]}"}
        add_field => { "year" => "%{[content][1]}"}
      }
    
      mutate {
        convert => {
          "year" => "integer"
        }
        strip => ["title"]
        remove_field => ["path", "host","@timestamp","message","content"]
      }
    }
    output {
       elasticsearch {
       	 # 将结果输出到ES中
         hosts => "http://localhost:9200"
         index => "movies"
         document_id => "%{id}"
       }
      stdout {}
    }
    
  • 执行sudo ./logstash -f logstash.conf启动Logstash

  • 启动后可以在控制台中看到大量数据在写入ES中

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值