在Flume中会使用一些拦截器对source中的数据在进入channel之前进行拦截做一些处理,比如过滤掉一些数据,或者加上一些key/value等。可以同时使用多个拦截器,实现不同的功能。
常用的拦截器有时间戳拦截器、主机名拦截器、静态拦截器等。
时间戳拦截器:会在event的Header中添加一个key为timestamp,value为当前时间戳的值。
主机名拦截器:会在event的Header中添加一个key(默认是host,也可通过hostHeader这个属性来自定义key),value是flume agent的主机名或IP(通过useIP这个属性值来定义,如果useIP设置为true(默认值是true),那么value就是用IP值,如果useIP设置为false,那么value就是用主机名)。
静态拦截器:在event的Header中添加自指定的静态的key/value。
案例-时间戳拦截器+主机名拦截器+静态拦截器:
- 创建自定义conf文件
[root@hadoop01 test_conf]# pwd
/usr/local/wyh/apache-flume-1.8.0-bin/test_conf
[root