Flume入门、小结、注意事项

一. 入门:安装、部署、及简单案例

  Flume 的安装,介绍,特性,核心概念等在这就不再赘述,请参考 http://www.aboutyun.com/thread-8917-1-1.html ,作者的介绍和案例都比较详细

二. HttpSource 使用小结

  这次主要拿 Flume 的HttpSource 做案例,用到了 File Roll Sink , HDFS Sink, 以实现将Http 的请求体 存到本地、 存到HDFS、及存到  Hive库的目的

  HttpSource 的案例请参考 https://my.oschina.net/pengqiang/blog/537380?p=  (需注意里面的http_test.conf 配置有一处拼写错误)

  注意几点: 

     (1) HttpSource  source 默认采用的handler 是 org.apache.flume.source.http.JSONHandler , 它的接收体是 List<Event>, 换言之它的接收体 是一个JsonArray,而且是有固定格式的 JsonArray, 其格式为 [{"headers":{"":""},"body":"the first event"},{"headers":{"":""},"body":"the second event"}], 即最外层必须是 [], header 是一个键值对map ,body 则是个字符串 ,例如 想发送  {"username":"xyz","password":"123"} 这样的json串, 应写成 [{"body":"{'username':'xyz','password':'123'}"}]

    (2) 控制台在输出日志时,仅输出body数据16字节内的数据,大于16字节将不会显示,但其实是完整收到了

    (3) 需要自定义请求格式,只需自定义handler实现 HTTPSourceHandler ,并重写其 getEvents() 方法即可

三. 记Flume-NG 一些注意事项

  参考 http://www.cnblogs.com/lxf20061900/p/4012847.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值