文章目录
2、配置“DistributeMapCacheServer”控制服务
5、启动MySQL,创建表“test2”测试“CaptureChangeMySQL”处理器
三、配置“RouteOnAttribute”处理器
3、连接“CaptureChangeMySQL”处理器与“RouteOnAttribute”处理器
1、配置“EvaluatejsonPath”的“PROPERTIES”属性
2、连接“RouteOnAttribute”处理器和“EvaluatejsonPath”处理器
五、配置“ReplaceText”处理器
1、配置“RelaceText”处理器“PROPERTIES”属性
2、连接“EvaluatejsonPath”处理器与“ReplaceText”处理器
六、配置Hive 支持HiveServer2
3、重启HDFS ,Hive ,在Hive服务端启动Metastore和HiveServer2服务
3、连接“ReplaceText”处理器与“PutHiveQL”处理器并设置关系
2、启动NiFi处理数据流程,向MySQL中写入数据,查看Hive中表数据
实时同步MySQL数据到Hive
案例:将mysql中新增的数据实时同步到Hive中。
以上案例需要用到的处理器有:“CaptureChangeMySQL”、“RouteOnAttribute”、“EvaluateJsonPath”、“ReplaceText”、“PutHiveQL”。
首先通过“CaptureChangeMySQL”读取MySQL中数据的变化(需要开启MySQL binlog日志),将Binlog中变化的数据同步到“RouteOnAttribute”处理器,通过此处理器获取上游数据属性,获取对应binlog操作类型,再将想要处理的数据路由到“EvaluateJsonPath”处理器,该处理器可以将json格式