Hive
Cym02
才疏学浅 欢迎大家一起沟通,讨论
展开
-
Hive中表分类概念介绍
表分类 – 由Hive全权管理的表 所谓的管理表指的是hive是否具备数据的管理权限,如果该表是管理表,当用户删除表的同时hive也会将表内对应的数据删除,因此在生产环境下,为了防止误操作,带来数据损失,一般考虑将表修改为非管理表-外部表。 总结:Hive的管理,表结构, hdfs中的数据文件,都归Hive全权管理。(hive删除管理表,HDFS对应文件也会被删除。) 缺点:数据不安全。 外部表 – 引用映射HDFS数据作为表管理,但无法删除数据 外部表和管理表最大的区别在于删除外部表,只是将MySQL中对原创 2020-12-06 17:04:43 · 168 阅读 · 0 评论 -
Hive中 HQL高级介绍及用法
SQL关键词执行顺序 from>where条件>group by>having条件>select>order by>limit 注意:一旦slq出现group by,后续的关键词能够操作的字段只有(分组依据字段,组函数处理结果) 常见步骤: 0.各个数据类型的字段访问(array、map、struct) 1. 条件查询:= != >= <= 2. and or between and 3. order by[底层会启动mapreduce进行排序] 4. .原创 2020-12-06 12:19:19 · 785 阅读 · 0 评论