在数仓这块实在有太多想写的了,又感觉写得不专业不系统,始终没有动起手来,就零散写一些简单的小技巧和工具吧!
通过KETTLE 生成MYSQL 到HIVE的建表语句:市场上这样的工具太少了,为了提升效率,简单写了一个作业来实现这个能力。
逻辑大致分为三步,
1.提供需要采集的业务库(mysql)的元数据读取权限,用于读取表 字段信息
2.通过构建SQL逻辑实现建表语句
3.建表语句追加方式输出 到文件
先看下实现的效果吧:
读取的资源库的表结构,然后生成建表语句,其中简单处理了一些字段类型对应
kettle 流程:
作业:
转换一:
核心点:表数据,将表名和scheam获取到 作为下游的参数: