- 博客(1)
- 收藏
- 关注
原创 大数据学习111
2、中间结果:数据清洗转换后的中间结果,可以存放在内部表,因为Hive对内部表支持的功能比较全面,方便管理。外表:元数据被hive管理,数据本身存储在hdfs上,不受hive管理。3、需要共享:处理完成的数据由于需要共享,可以存储在外部表,这样能够防止失误操作,增加数据的安全性。location : 设定该表存储的hdfs目录,如果不手动设定,则采用hive默认的存储路径。2.视图:本身不存储实际数据,只存储表关系。union:查询所有数据,总体去重,要求表的字段和类型完全一致。
2024-05-15 23:16:21 388
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人