- 博客(2)
- 收藏
- 关注
原创 hive认识1
sparksql presto impala 只要能够访问hive Metastore 就可以访问 Hive里面表的数据。2.延时性:hive适用于 离线计算 慢 千万不要拿hive和mysql的执行性能对比。表的名字、字段的名字、字段的类型、谁创建的、数据存储在哪。2.数据存储 和 计算角度 :hadoop进行扩展。3.Metastore 【Hive的元数据管理】1.元数据:描述数据的数据 schema。7.数据体量: 量大 vs TB pb数据。2.hive 的架构 rdbms。
2022-12-12 21:27:19 246 1
原创 Hive认识
hive on spark =》 hive的引擎是spark 生产上用的不多。spark on hive =》 sparksql 查询hive的里面表。mapreduce:hive的作业可以以MR的方式去运行。1.定义了一种类sql的语言 =》 类似sql 又不完全相同。hdfs: hive的数据是存储在hdfs之上的。yarn:hive的作业是可以跑在yarn之上的。1.做基础平台:涉及的底层的面是非常广的。必然是有一个新的东西诞生 去解决某一类场景的问题。yarn的执行流程一定要会的。
2022-12-12 21:23:54 107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人