hive结合python

CREATE TABLE IF NOT EXISTS user(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';


CREATE TABLE IF NOT EXISTS job(id int, position string, user_id int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';


CREATE TABLE IF NOT EXISTS user_job(new_id int, new_name string,new_job_id int, new_position string, new_user_id int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';


INSERT OVERWRITE TABLE user_job
SELECT  TRANSFORM(user.id,user.name,job.id, job.position, job.user_id) USING 'python weekday_mapper.py' 
AS (new_id, new_name,new_job_id, new_position, new_user_id)  FROM user  join  job on user.id = job.user_id  


weekday_mapper.py 代码


#!/bin/env python
import sys
import datetime
for line in sys.stdin:
    line = line.strip()


    new_id, new_name_suiyi, new_job_id, new_position, new_user_id = line.split('\t') #输入源字段,我理解是输入源的占位符


    #这里可以根据输入源字段赋值,组成新的值,
    new_name = new_name_suiyi+'李逵'


    print '\t'.join([new_id, new_name, new_job_id, new_position, new_user_id]) #输出的新值必须和新的表字段对应
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值