Hive如何建表+导入数据+导出大文件

本文介绍了Hive如何创建表,包括数据列分隔符、行分隔符和文件格式设置。还详细讲解了导入外部数据的步骤,如数据格式处理和上传至Hive路径。同时,提到了导入其他表数据和重写表数据的方法。在导出大文件部分,建议使用INSERT OVERWRITE DIRECTORY导出到特定目录,以便于传输和后续处理。此外,文章还讨论了Hive中删除分区数据的两种方式:TRUNCATE和DROP Partition,以及它们的区别。
摘要由CSDN通过智能技术生成

1.建表
fields terminated by 数据列分隔符,根据实际情况定

lines terminated by 数据行分隔符,根据实际情况定

partitioned表示分区,数据量不大、无区域数据调整的情况下,一般不用分区。不用时,直接将 PARTITIONED BY(**) 删除即可

stored as 文件格式,见《Hive文件格式(表STORE AS 的四种类型)》

location 对应一个目录

建表语句如下:

drop table if exists HiveTest_1;
create external table HiveTest_1(
 activity_id string comment '活动id'
,tocc_name   string comment '活动名称'
,app_key     string
,page   string
,visit_type   string comment '访问类型'
)
PARTITIONED BY (
day string	
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值