今天在hue上执行数据的重新导入:
1、删除原先的kudu表:drop table events_tab_2;
2、需要在impala里创建kudu新表:
CREATE TABLE events_tab_2( user_id STRING , item_id STRING , create_time BIGINT , col_1 STRING , col_12 STRING , col_13 STRING , col_14 STRING , col_15 STRING , col_16 STRING , col_17 BIGINT , col_18 BIGINT , col_19 STRING , col_20 DOUBLE , col_21 BIGINT , col_22 BIGINT , col_23 BIGINT , col_24 STRING , col_25 STRING , col_26 STRING , col_28 BIGINT , col_32 STRING , PRIMARY KEY (user_id, item_id, create_time) ) PARTITION BY HASH (user_id) PARTITIONS 16 STORED AS KUDU;
3、将数据导入。
在执行第2步的时候,遇到了坑和错误:
错误指示:这个表已经存在!
去impala表里和hdfs仔细检查后,这个表并不存在!
那问题在哪?
我搜了好多资料,也没有找到具体的解决方法,后来经过尝试探索,发现是
kudu单独存到了它自己的‘区域’;
解决方法:
在linux命令里输入: