- 博客(2)
- 收藏
- 关注
原创 数据仓库及应用(hive基础)
总的来说,Hive在Hadoop生态系统中的位置是作为一个用于数据仓库、数据查询和分析的工具,它通过HiveQL语言将SQL查询转换为MapReduce任务或Tez任务,从而实现对Hadoop集群中大规模数据的查询和分析。Hive表分为内部表和外部表:内部表类似于RDBMS中的表,由Hive管理 外部表指向已经存在HDFS中的数据,外部表的真实数据不被Hive管理。包含Hive的数据存储与计算的内容,Hive元数据存储在RDBMS中,数据存储在HDFS中,计算由MR完成。
2024-05-23 16:08:31
339
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人