开源日志收集软件fluentd 转发(forward)架构配置

最新推荐文章于 2024-09-02 09:27:06 发布

weixin_34268753

最新推荐文章于 2024-09-02 09:27:06 发布

阅读量244

点赞数

文章标签：大数据

原文链接：http://blog.51cto.com/shineforever/1599771

版权

需求：

通过开源软件fluentd收集各个设备的apache访问日志到fluentd的转发服务器中，然后通过webHDFS接口，写入到hdfs文件系统中。

软件版本说明：

hadoop版本：1.1.2

fluentd版本：1.1.21

测试环境说明：

node29服务器上安装了apache，以及fluentd，作为fluentd的客户端；

node1服务器，为hadoop服务器的namenode；

node29服务器上fluentd配置文件：

<source>
  type tail
  format apache2
  path /var/log/httpd/access_log
  pos_file /var/log/td-agent/access_log.pos
  time_format %Y-%m-%d %H:%M:%S
  localtime
  tag apache.access
 
</source>

#Log Forwarding to node1 server
<match apache.access>
  type forward
#  time_slice_format %Y%m%d
#  time_slice_wait 10m
#  localtime
 
#定义日志入库日志的时间；
  time_format %Y-%m-%d %H:%M:%S
#localtime非常重要，不设置日志时间和系统时间相差8小时；  
  localtime
 
#定义入库日志的时间；
 
  <server>
  host node1
  port 24224
  </server>
 
  flush_interval 1s
</match>

node1服务器配置，这个服务器上配置了hadoop的namenode，以及作为fluentd的转发角色，具体配置文件如下：

<source>
  type forward
  port 24224
</source>

type webhdfs

host node1.test.com

port 50070

path /apache/%Y%m%d_%H/access.log.${hostname}

time_slice_format %Y%m%d

time_slice_wait 10m

#定义日志入库日志的时间；

time_format %Y-%m-%d %H:%M:%S

localtime

flush_interval 1s

</match>

配置好以后，重启fluentd服务；

开始测试，在node29用ab命令开始访问apache，生成访问日志；

然后，到node1服务器上去查看HDFS文件系统中，是否生成了相关文件及目录：

查看生成的目录：

查看文件里面具体日志：

hadoop fs -cat /apache/20150106_16/access.log.node1.test.com

如上图所示，fluentd已经通过转发模式，把node29服务器上apache日志收集到hdfs文件系统中了，方便下一步用hadoop进行离线分析。

转载于:https://blog.51cto.com/shineforever/1599771

weixin_34268753

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫