Pentaho Work with Big Data(四)—— 转换Hive里的数据

1. 建立hive表,导入原始数据,过程参考
http://blog.csdn.net/wzy0623/article/details/51133760

2. 建立一个作业,查询hive表,并将聚合数据写入一个hive表
(1)打开PDI,新建一个作业,如图1所示。


图1

(2)建立一个hive的数据库连接,如图2所示。


图2

说明: kettle连接hive的相关配置参考 http://blog.csdn.net/wzy0623/article/details/50903133
(3)共享数据库连接(可选)
(4)编辑'SQL'作业项,如图3所示。


图3

(5)保存并执行作业,日志如图4所示。


图4

从图4可以看到,作业已经成功执行。
(6)检查hive表,结果如图5所示。


图5

从图5可以看到,新建了weblogs_agg表,并装载了聚合数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值