使用flume采集linux本地文件至kafka

最新推荐文章于 2024-06-13 17:57:55 发布

上等猪头肉

最新推荐文章于 2024-06-13 17:57:55 发布

阅读量779

点赞数

分类专栏： flume

本文链接：https://blog.csdn.net/qq_36168479/article/details/89000697

版权

flume 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

编写配置文件

vim dir_kafka.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1
#对于source的配置描述 监听avro
a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir =/opt/access.log
a1.sources.r1.fileSuffix=.FINISHED
a1.sources.r1.deserializer.maxLineLength=5120
#对于source的配置描述 监听文件中的新增数据 exec
a1.sources.r1.type = exec
a1.sources.r1.command  = tail -F /opt/log/access.log
a1.sources.ri.shell = /bin/sh -c
#对于sink的配置描述 使用kafka做数据的消费
a1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = kk7
a1.sinks.k1.brokerList = 192.168.88.11:9092,192.168.88.12:9092,192.168.88.13:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 20
#对于channel的配置描述 使用内存缓冲区域做数据的临时缓存
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

#通过channel c1将source r1和sink k1关联起来
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

flume 启动命令

./flume-ng agent -c /usr/local/flume/conf -f /usr/local/flume/conf/dir-hdfs.conf -n a1 -Dflume.root.logger=INFO,console

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

上等猪头肉

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Flume实时采集mysql数据到kafka中并输出

Alex的博客

11-30

5763

Flume实时采集mysql数据到kafka中并输出。Apache Flume是一个分布式的、可靠的、可用的系统，用于有效地收集、聚合和将大量日志数据从许多不同的源移动到一个集中的数据存储。在大数据生态圈中，flume经常用于完成数据采集的工作。其实时性很高，延迟大约1-2s，可以做到准实时。又因为mysql是程序员常用的数据库，所以以flume实时采集mysql数据库为例子。要了解flume如何采集数据，首先要初探其架构：Flume 运行的核心是 Agent。Flume以agent为最小的独立运行单位。

接收实时数据 MySQL+Flume+Kafka 配置整合

jaaaaa_的博客

04-24

2752

话不多说，直接切入主题前情概要：编写scala代码，实现定时插入数据到MySQL的功能，模拟实时数据情景工具版本信息： Flume：1.9.0 Kafka：2.11-2.3.1 MySQL：5.6.13 基本架构：数据源只有MYSQL，所以采集者Flume和MySQL在同一服务器消费者Kafka我选择集群分布 host server leader MySQL,zookeeper,Kafka,Flume follower1 zookeeper,Kafka follow

参与评论您还未登录，请先登录后发表或查看评论

flume读取文件到kafka

欢迎大神交流讨论

11-10

1832

1.进入flume官网 www.org.apache.flume.com 点击第三个 2.使用kafka前需要先开启zookeeper 3.编写配置文件读文件首先最好去头写好配置文件 user.channels = c1 user.sources = s1 user.sinks = k1 user.sources.s1.type = spooldir user.sources.s1.spoolDir = /opt/mydate/users/ user.sources.s1....

本地文件到通过flume到kafka

weixin_34351321的博客

01-13

135

配置文件 cd /usr/app/flume1.6/conf vi flume-dirKakfa.properties #agent1 name agent1.sources=source1 agent1.sinks=sink1 agent1.channels=channel1 #Spooling Directory #set source1 agent1.sources.source1.ty...

flume 实时读取本地文件到kafka

小哇

10-02

1356

本文写的比较简单，因为都大同小异，如果忘记flume的使用和语法等，可以看下如下文章，回顾下 flume 实时读取本地文件到hdfshttps://blog.csdn.net/qq_41712271/article/details/103939224 #Name the components on this agent a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source a1.sources.r

使用flume将本地文件（/opt/app/flume_test/test2024.txt）采集到kafka的first主题下

最新发布

yzx20030123的博客

06-13

652

使用flume将本地文件（/opt/app/flume_test/test2024.txt）采集到kafka的first主题下

flume采集日志发送至kafka

fengchengwu2012的博客

11-20

1251

flume采集数据源为lo日志

Flume实操指南与从Kafka拉取数据到HDFS

weixin_42147245的博客

06-07

1879

1. Flume简介 Flume是Cloudera提供的一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。本文主要介绍Flume的实际操作，因此不对其原理和细节进行更多介绍，对于Flume的相关介绍可以参考以下文章：分布式日志收集系统 —— Flume Flu

Flume+Kafka+SparkStreaming实时统计网站日志--3、Flume采集数据到Kafka

ylqdh的博客

11-13

846

Flume采集日志数据到Kafka过程中Flume配置文件写法，Kafka topic创建、消费者查看结果

日志采集方案和集群flume+kafka+elasticsearch

flyingant9的博客

09-24

493

准备工作： 1、服务器三台 172.16.xx.17 172.16.xx.18 172.16.xx.19 2、更改主机名（可选，本机器主机名太长） vi /etc/hosts vi /etc/systemconfig/network 3、安装jdk：jdk-8u131-linux-x64.tar.gz 1.8版本，不按照会出现莫名错误、jps无法使用配置/etc/profile export JAVA_HOME=/usr/java/jdk1.8.0_131 export JRE_HOME=JAVAHOME

flume实时采集全量或者增量文件或者文件夹数据到kafka

qq_44962075的博客

07-11

3578

flume实时采集全量或者增量文件或者文件夹数据到kafka 这里安装的Flume单节点，Kafka单节点，目标是通过Flume去读取文件中的历史数据导入到kafka中，还有就是将实时更新的数据传输到kafka中。一、Flume安装 Flume的安装使用可以说非常简单，直接进官网：http://flume.apache.org/ 最新是1.9.0版本，我们选择1.8.0版本下载。配置flume的环境变量:略二、kafka安装 kafka官网：http://kafka.apache.org/dow

Flume实时采集日志数据写入到Kafka

热门推荐

weixin_44455388的博客

11-01

1万+

一、为flume构建agent 先进去flume下的配文件夹里面 (此处我的配置文件夹名字为：myconf) 编写构建agent的配置文件（命名为：flume2kafka.conf） flume2kafka.conf # 定义这个agent中各组件的名字 a1.sources = r1 a1.sinks = k1 a1.channels = c1 # 描述和配置source组件：r1 a1...

大数据菜鸟实战一：使用flume收集数据到KafKa

霍城延的随笔

08-05

883

flume连接到kafka配置文件编写

dd1296的博客

08-19

901

flume像要连接到kafka主要需要编写sinks的配置，其他的正常用spooldir的配置就行话不多说，直接上代码 user_friends.sources = userFriendSource user_friends.channels = userFriendChannel user_friends.sinks = userFriendSink user_friends.sources.userFriendSource.type = spooldir user_friends.sources.u

apache flume 配置存储在Linux本地服务器

chengwa9834的博客

06-07

138

在Linux上flume的配置： agent.channels = ch-1 agent.sources = src-1 agent.sinks = sink-1 agent.sources.src-1.interceptors = i1 agent.sources.src-1.interc...

flume与kafka实战配置

zhm的博客

12-11

1782

flume与kafka实战配置 1. 概述在实战中，产生日志文件的服务器和hadoop集群一般不是在同一个服务器上，这时需要使用Flume avro架构模型，在web服务器上搭建一个flume,在hadoop集群上搭建一个flume。在这方便测试我们使用如下架构测试. 2. Flume avro架构模型 3.flume-webserver.properties 配置文件特别说明：下面配置是f...

flume+kafka使用

大杂烩

10-11

958

1、下载flume的安装包，解压至任一路径。 2、搭建kafka集群。 3、配置flume的配置文件，将其命名为kafka.conf，如下。 agent.sources.s1.type = spooldir agent.sources.s1.spoolDir = /tmp/cdz/log agent.sources.s1.fileHeader = false agent.sour

flume+kafka搭建

minmax329的博客

02-11

615

前面kafka集群已经成功，这里只需要配置好conf/ flume-conf.properties文件，配置如下。执行上面的main方法作为flume的client端来产生数据，可以在上面的consumer监听里面看到结果。Flume解压既安装成功，配置conf/ flume-conf.properties文件启动完成相应的功能。建议下载最新的1.6.0版本的，因为1.6.0版本的集成了整合kafka的插件包可以直接配置使用。注意这里的a1指的是配置文件中的agent名字a1不是随意写的。

java远程实时监听linux服务器日志文件并写入kafka

Cmm_CSDN的博客

12-24

2500

主要需求：连接远程服务器（HBase写入端），监听HBase写入日志，截取ROWKEY，写入Kafka。实现方式：通过ch.ethz.ganymed包ganymed-ssh2远程连接linux服务器，执行tail命令，生成实时数据流，写入kafka 主要代码： pom.xml <dependency> <groupId>org.apache.kafka...

构建云时代日志采集与管理系统：Flume、Zookeeper、Kafka与Storm详解

在现代IT环境中，日志采集系统搭建是至关重要的，尤其在迈进云时代，实时日志分析能力对于监控、故障排查和业务优化具有不可估量的价值。本文档提供了一套详细的日志采集系统搭建指南，适用于CentOS 7操作系统环境，...