hive 内部表和外部表的区别

本文介绍了Hive内部表和外部表的主要区别,包括元数据管理和数据删除行为。内部表在删除时会同时移除元数据和数据,而外部表仅删除元数据,数据在HDFS中保留。对于临时操作和数据安全性,内部表和外部表各有优势。外部表的路径可自定义,有利于权限控制。在创建和删除外部表时需要注意数据重复问题,以避免数据丢失或冗余。
摘要由CSDN通过智能技术生成

hive 内部表和外部表的区别

  1. 内部表没有external 关键字

  2. 内部表可以不指定 location关键字,当然hivesql执行外部表是也可以不指定,但是一般不这么用,sparksql,执行时不指定会报错

  3. 内部表删除表时,直接删除元数据以及实际数据,外部表则只会删除元数据,hdfs上保留数据,

    这一条会衍生一些东西

    • 如果建立临时表,一般使用内部表,这样可以直接删除数据,不至于导致数据多余
    • 删除外部表时,再create table ,然后insert overwrite 时,会使数据重复一倍,需要注意,这时候需要再insert overwrite一次,
    • 外部表数据是hdfs控制,更加安全
  4. 由于外部表的路径可以指定,不会跑到默认的/user/hive/warehouse下面去,所以权限更加好控制

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值