1、简介
上一篇blog提到用Flink消费Kafka的数据,kafka的produce是用kafka console produce的。今天主要测试下kafka的produce程序(scala编写),模拟在应用服务器上日志的收集,看看Flink能否正常消费数据。
这里的producer实现了每隔3秒去查找特定目录下的文件,将文件的内容批量produce到kafka(async),然后将文件重命名并移动到另外的目录。
2、代码
2.1、添加maven依赖
<!--kafka相关的依赖-->
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka_2.10</artifactId>
<version>0.8.2.1</version>
</dependency>
<!--scala相关的依赖-->
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.10.4</version>
</dependency>
<!--reflect IO的依赖-->
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-reflect</artifactId>
<version>2.10.4</