自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 hive认识1

sparksql presto impala 只要能够访问hive Metastore 就可以访问 Hive里面表的数据。2.延时性:hive适用于 离线计算 慢 千万不要拿hive和mysql的执行性能对比。表的名字、字段的名字、字段的类型、谁创建的、数据存储在哪。2.数据存储 和 计算角度 :hadoop进行扩展。3.Metastore 【Hive的元数据管理】1.元数据:描述数据的数据 schema。7.数据体量: 量大 vs TB pb数据。2.hive 的架构 rdbms。

2022-12-12 21:27:19 246 1

原创 Hive认识

hive on spark =》 hive的引擎是spark 生产上用的不多。spark on hive =》 sparksql 查询hive的里面表。mapreduce:hive的作业可以以MR的方式去运行。1.定义了一种类sql的语言 =》 类似sql 又不完全相同。hdfs: hive的数据是存储在hdfs之上的。yarn:hive的作业是可以跑在yarn之上的。1.做基础平台:涉及的底层的面是非常广的。必然是有一个新的东西诞生 去解决某一类场景的问题。yarn的执行流程一定要会的。

2022-12-12 21:23:54 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除