flume采集日志到kafaka

最新推荐文章于 2023-12-22 07:23:21 发布

weixin_34174105

最新推荐文章于 2023-12-22 07:23:21 发布

阅读量310

点赞数

文章标签：大数据操作系统 shell

原文链接：https://juejin.im/post/5a27f39b6fb9a0451a764376

版权

1.写一个shell脚本log.sh，产生数据

#bin/bash for((i=0;i<=10000;i++)) do echo "message-" +$i >> /home/hadoop/flume_source/click_log/1.log done

2.在flume的conf目录中配置采集数据方案exec.conf

a1.sources = r1 a1.sinks = k1 a1.channels = c1

Describe/configure the source

a1.sources.r1.type = exec a1.sources.r1.command = tail -F /home/hadoop/flume_source/click_log/1.log a1.sources.r1.channels = c1

Describe the sink

Use a channel which buffers events in memory

a1.channels.c1.type = memory a1.channels.c1.capacity = 1000 a1.channels.c1.transactionCapacity = 100

Bind the source and sink to the channel

a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink a1.sinks.k1.topic = test a1.sinks.k1.brokerList = 192.168.1.148:9092 a1.sinks.k1.requiredAcks = 1 a1.sinks.k1.batchSize = 20 a1.sinks.k1.channel = c1

3.开启zookeeper集群，kafka集群，启动flume bin/flume-ng agent -n a1 -c conf -f conf/exec.conf -Dflume.root.logger=INFO,console

启动kafka的消费者进行监控 kafka-console-consumer.sh --zookeeper min1:2181 -from-beginning --topic test 运行shell脚本sh log.sh 4.可以在consumer中看到如下数据监控：

转载于:https://juejin.im/post/5a27f39b6fb9a0451a764376

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34174105

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

大数据-从flume采集数据通过kafaka下沉到hive表的一个详细案列

jiayunfei521的博客

10-24

909

HDFS 实施前的准备安装nginx 安装flume 安装kafka 打jar包双击package即可打成jar包在此处可以看到打成jar包的地址将jar包运行在虚拟机上我准备了四台虚拟机我将jar包 ...

flume采集数据采集与kafaka交互报错：java.lang.OutOfMemoryError:java heap space

weixin_43390992的博客

04-07

1240

详细报错如下图： ##解决办法：进入flume bin目录下，修改flume-ng文件，如下图：红框的地方默认是20m，可以根据自己服务器内存大小设置，我这里设置的是10240m(也就是10个g) 根据以上的报错，自己也进行搜索并整理了细节的东西，供需要的小伙伴们参考：博文地址：记flume部署过程中遇到的问题以及解决方法配置flume采集kafaka日志导入hdfs（采用的file...

参与评论您还未登录，请先登录后发表或查看评论

Flume采集数据到Kafka,然后从kafka取数据存储到HDFS的方法思路和完整步骤

03-08

自己研究大数据多年，写的一个日志数据采集方案笔记，可快速熟悉Flume，Kafka，Hdfs的操作使用，以及相互的操作接口。

【采集层】Kafka 与 Flume 如何选择（转）

weixin_34128411的博客

11-13

499

原文链接：【采集层】Kafka 与 Flume 如何选择采集层主要可以使用Flume, Kafka两种技术。 Flume：Flume 是管道流方式，提供了很多的默认实现，让用户通过参数部署，及扩展API. Kafka：Kafka是一个可持久化的分布式的消息队列。 Kafka 是一个非常通用的系统。你可以有许多生产者和很多的消费者共享多个主题Topics。相比之下,Flume是一...

【Strom篇】Flume+Kafaka+Strom整合完成信息记录

chenshi_2753的博客

05-06

1122

第一部分：流程分析由flume收集客户端发送的信息，经过kafka集群消费者收集，然后给storm集群数据处理（数据清洗），最后再发给kafka集群收集。第二部分：集群搭建 flume+kafka 一、配合flume 修改flume-env.sh里的JAVA_HOME的位置，（flume仅修改此处）（若查看flume的版本通过：./bin flume-ng version...

Flume+Kafka整合

weixin_33701251的博客

06-19

脚本生产数据---->flume采集数据----->kafka消费数据------->storm集群处理数据日志文件使用log4j生成，滚动生成！当前正在写入的文件在满足一定的数量阈值之后，需要重命名！！！ flume+Kafka整合步骤及相关配置：（先安装好zookeeper集群和Kafka集群）配置flume： 1、下载flume 2...

Kafka日志

qq_37586986的博客

12-22

572

待补充。

最好的大数据项目。用flume-kafaka-flume进行日志的读取，在hive设计数仓.zip

最新发布

03-09

本项目聚焦于大数据处理，利用Apache Flume、Kafka以及Hive构建了一个高效的数据采集、传输与存储系统，旨在实现日志数据的有效管理和分析。以下将详细阐述项目中的关键技术及其应用。 1. Apache Flume：Flume 是一...

Flume学习-采集端口数据存入kafka

HaveAGoodDay428的博客

03-15

3213

Flume学习-采集端口数据存入kafka

Docker系列(六) docker环境下安装flume 实现logs+flume+kafka日志采集镜像安装

海鸥~

08-02

6874

以下均为生产环境下亲测使用如有出入请私信梁工一、安装flume 1、docker中查看镜像 docker search flume 2、pull 新版稳定 flume2.0.0 docker pull probablyfine/flume:2.0.0 3、创建一个flume文件夹里面包含 conf logs conf : 文件夹下放我们写的配置文件 sources channel sink logs : 对容器内的logs在本地做映射以下为从log.

kafaka 日志收集

FYR1018的博客

07-03

766

1 Kafka 架构深入1.1 Kafka 工作流程及文件存储机制2 Filebeat+Kafka+ELK

Flume + Solr + log4j搭建web日志采集系统

whs_321的博客

08-04

561

很多web应用会选择ELK来做日志采集系统，这里选用Flume，一方面是因为熟悉整个Hadoop框架，另一方面，Flume也有很多的优点。

Flume与kafka集成

张鑫的博客

08-07

1082

配置flume(flume-kafka.conf)：这里采用一个source和一个sink的配置，当然可以配置成多个source # define a1.sources = r1 a1.sinks = k1 a1.channels = c1 # source：指定监控的日志文件 a1.sources.r1.type = exec a1.sources.r1.command = tail -F...

Kafka集成Flume

Jery.Peng的博客

05-23

1511

Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。日志收集 Flume最早是Cloudera提供的日志收集系统，是Apache下的一个孵化项目，Flume支持在日志系统中定制各类数据发送方，用于收集数据。数据处理 Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。Flume提供了从cons

flume+kafka使用

大杂烩

10-11

938

1、下载flume的安装包，解压至任一路径。 2、搭建kafka集群。 3、配置flume的配置文件，将其命名为kafka.conf，如下。 agent.sources.s1.type = spooldir agent.sources.s1.spoolDir = /tmp/cdz/log agent.sources.s1.fileHeader = false agent.sour

Kafka/flume知识概要

TU_JCN的博客

07-08

1869

Kafka/flume概要

记录一下互联网日志实时收集和实时计算的简单方案

12-26

1586

Rec: FuRenjie 阅读目录 Kafka中的数据分区及副本Flume拦截器的使用Flume消费者的负载均衡和容错实时计算模块其它实时数据消费者相关阅读作为互联网公司，网站监测日志当然是数据的最大来源。我们目前的规模也不大，每天的日志量大约1TB。后续90%以上的业务都是需要基于日志来完成，之前，业务中对实时的要求并不高，最多也就是准实时（延迟半小时

kafka入门之broker--日志存储设计

weixin_30270561的博客

07-20

328

kafaka并不是直接将原省消息写入日志文件的，相反，它会将消息和一些必要的元数据信息大宝在一起封装成一个record写入日志。其实就是我们之前介绍的batch 具体对每个日志而言，kafka又将其进一步细分成日志段文件以及日志段索引文件，每个分区日志都是由若干日志段文件+索引文件构成的。创建topic时，kafka为该topic的每个分区在文件系统中创建了一个对应的子目录，...

flume/kafaka/spqrk测试用例

喜上眉梢

07-03

594

flume+spark(一) 一、flume代码 #exec source + memory channel + hdfs sink # Name the components on this agent a2.sources = r1 a2.sinks = k1 a2.channels = c1 # Describe/configure the source a

Flume大数据日志采集实战教程

教程涵盖了Flume的入门到高级应用，包括快速入门、核心概念解析、企业级实践、自定义组件创建、监控等多个方面，旨在帮助学习者掌握这一重要的大数据日志采集工具。" Flume，作为Apache Hadoop生态中的一个关键组件...