下面是使用hive过程中一些心得体会,有不对的地方欢迎大家拍砖。
1. hive 内部表和外部表(管理表)的异同点:
- 不同点:外部表和内部表对数据的控制权不同。外部表删除的时候也不会删除数据。内部表删除的时候会删除数据。
- 相同点1:执行 ALTER TABLE test1 ADD PARTITION(day=$day,hour=$hour) LOCATIO 'file:///home/data/log_cache_new' 语句时不发生数据的移动。
- 相同点2:LOAD DATA INPATH 'file:///home/data/log_cache_new' OVERWRITE INTO TABLE test1 PARTITION(day=$day,hour=$hour) 时发生数据的移动。
- 相同点3: 无论是外部表和内部表对数据都没有绝对控制权。