kudu表数据的导入导出,处理null值问题

nvguiyachuang

已于 2022-02-10 16:01:34 修改

阅读量2k

点赞数

分类专栏： kudu 文章标签： hive hadoop big data

于 2022-01-17 17:47:57 首次发布

本文链接：https://blog.csdn.net/qq_46160502/article/details/122544891

版权

1 篇文章 0 订阅

订阅专栏

kudu to csv to hive to kudu

create table default.kudu_table(
id string not null,
ts bigint,
count bigint,
primary key(id)
)
PARTITION BY HASH (id) PARTITIONS 6 STORED AS KUDU;

insert into default.kudu_table values (“1”, 11, 11), (“2”, 22, 22)

impala-shell -q ‘select * from default.kudu_table’ -B --output_delimiter="*" -o /data/tmp/test.csv

create table default.kudu_table2(
id string,
ts bigint,
count bigint)row format delimited fields terminated by ‘*’;

alter table default.kudu_table2 SET SERDEPROPERTIES(‘serialization.null.format’ = ‘NULL’);

load data local inpath ‘/data/tmp/test.csv’ into table default.kudu_table2;

create table default.kudu_table3(
id string not null,
ts bigint,
count bigint,
primary key(id)
)
PARTITION BY HASH (id) PARTITIONS 6 STORED AS KUDU;

insert into default.kudu_table3 select * from default.kudu_table2;

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注