离线数据分析：kafka+logstash+elasticsearch

最新推荐文章于 2024-07-13 11:10:40 发布

鲲鹏飞九万里

最新推荐文章于 2024-07-13 11:10:40 发布

阅读量436

点赞数

分类专栏：大数据解决方案文章标签：大数据数据采集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hefrankeleyn/article/details/79954407

版权

大数据解决方案专栏收录该内容

5 篇文章 0 订阅

订阅专栏

elasticsearch也能够存储大量的数据，和hdfs相比有很大的优势：使用hdfs进行数据分析的时候，需要将所有的数据全部都加载出来，然后用一个filter进行过滤，这个时候占用了大量的资源。有些时候，只是从大量的数据中过滤出很少一部分数据，elasticsearch能够通过查询条件，将想要的数据结果返回给你，这样不会占用大量的资源，所以效率会比较高。

通过logstash将kafka中的数据加载到elasticsearch，需要配置logstash的配置文件（kafka-es.conf）：

input {
  kafka {
    type => "level-one"
    auto_offset_reset => "smallest"
    codec => plain {
      charset => "UTF-8"
    }
        group_id => "es"
        topic_id => "gsTopic03"
        zk_connect => "mini02:2181,mini03:2181,mini04:2181"
  }
}

filter {
  mutate {
    split => { "message" => "   " }
      add_field => {
        "event_type" => "%{message[3]}"
        "current_map" => "%{message[4]}"
        "current_X" => "%{message[5]}"
        "current_y" => "%{message[6]}"
        "user" => "%{message[7]}"
        "item" => "%{message[8]}"
        "item_id" => "%{message[9]}"
        "current_time" => "%{message[12]}"
     }
         #原来的message不要了
     remove_field => [ "message" ]
  } 
}

output {
    elasticsearch {
      index => "level-one-%{+YYYY.MM.dd}"
          codec => plain {
        charset => "UTF-8"
      }
      hosts => ["mini02:9200", "mini02:9200", "mini02:9200"]
    } 
}

在集群中启动elasticsearch：

./elasticsearch/bin/elasticsearch -d

鲲鹏飞九万里

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

鲲鹏飞九万里 CSDN认证博客专家 CSDN认证企业博客

码龄7年

350: 原创

3万+: 周排名

9211: 总排名

40万+: 访问

: 等级

5886: 积分

177: 粉丝

210: 获赞

62: 评论

676: 收藏

私信

关注

分类专栏

最新评论

Java开发：文件上传和下载
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
从缓存到redis
小王毕业啦: 博主的文章对于“从缓存到redis”这个主题进行了深入的探讨，让我对这个领域有了全新的认识。文章中的细节描写非常到位，展现了博主深厚的专业知识和功底。期待博主未来能够持续分享更多类似的好文，让读者们受益匪浅。同时，也希望能够得到博主的指导和支持，共同进步成长。感谢博主的付出和分享，让我们在技术的道路上能够一起前行！
将组件发布到Maven中央仓库
鲲鹏飞九万里: 视频教程：https://www.bilibili.com/video/BV14p421Q7gy/?vd_source=1be1584b8f579191e7329b8d0062c2c5
Spring Web Flow 实战案例
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)提升标题与正文的相关性。
Java工具总结：将数据内容写入excel文件
鲲鹏飞九万里: “四、分析代码 ”下面有一个gitlhub的地址，代码都在里面

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。