Hive中提供多个语法来使用streaming,包括1)map(); 2) reduce();3)transform().
1.transform返回的字段类型.
默认情况下,transform返回的字段的 数据类型 是字符串类型。
如果需要更改transform返回的字段类型,则使用如下语句:
select transform(col1, col2) using ‘python test.py’
as (newA int, newB double) from tableA;
2.几种基本用法.
1)恒等运算,使用 bin/cat.
select transform(col1, col2) using ‘/bin/cat’
as (newA int, newB double) from tableA;
2)投影变换,使用 bin/cut,实现功能:提取或者映射.
select transform(col1, col2) using ‘/bin/cat’
as (newA int, newB double) from tableA;