AhQgy-CSDN博客

原创 hive认识1

sparksql presto impala 只要能够访问hive Metastore 就可以访问 Hive里面表的数据。2.延时性：hive适用于离线计算慢千万不要拿hive和mysql的执行性能对比。表的名字、字段的名字、字段的类型、谁创建的、数据存储在哪。2.数据存储和计算角度：hadoop进行扩展。3.Metastore 【Hive的元数据管理】1.元数据：描述数据的数据 schema。7.数据体量：量大 vs TB pb数据。2.hive 的架构 rdbms。

2022-12-12 21:27:19 246 1

原创 Hive认识

hive on spark =》 hive的引擎是spark 生产上用的不多。spark on hive =》 sparksql 查询hive的里面表。mapreduce：hive的作业可以以MR的方式去运行。1.定义了一种类sql的语言 =》类似sql 又不完全相同。hdfs： hive的数据是存储在hdfs之上的。yarn：hive的作业是可以跑在yarn之上的。1.做基础平台：涉及的底层的面是非常广的。必然是有一个新的东西诞生去解决某一类场景的问题。yarn的执行流程一定要会的。

2022-12-12 21:23:54 107

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人