Hive中的Parquet表本质是一种被压缩了的二进制文件,不方便对其进行操作编辑
方法一:(针对数据量不大时)
优点:方便、快捷
insert into table TABLE_NAME1 partition(dt="2019-09-05")
select
32451,"支付卡券11111qaz",19,19,"2019-09-06 17:34:19"
from TABLE_NAME2
limit 1;
TABLE_NAME1:目标表名
TABLE_NAME2:任意选取一个实际存在的表(1、数据量不大;2、数据条数大于插入条数)
方法二:(针对数据量较大时)
步骤一:将数据存入文本文档中(.txt)
步骤二:建立txt格式表
-- 创建txt格式表:
create table cdim.dim_city_rank(
rank int comment "城市排名",
city_id int comment "城市id",
city_name string comment "城市名称",
province string comment "省份",
short_word string comment "简称",
pinyin string comment "城市拼音名"
) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
。。。详细 转https://blog.csdn.net/weixin_40873462/article/details/99979474
步骤三:将步骤一中的数据存入步骤二中的表中
步骤四:将步骤三中表的数据用sql读出写入目标表中