自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 深入了解Hiv

函数分类输入输出标准函数以一行数据的一列或多列数据作为输入且返回结果是一个值。聚合函数以多行的零列或多列的数据作为输入且返回单一值。表生成函数接受零个多多个输入且产生多列或多行输出。1.查看函数​。

2024-06-28 17:29:53 1675

原创 Hive入门级教学

内部表类似于RDBMS中的表,电Hive管理,外部表指向已经存在HDFS中的数据,与内部表元数据组织是相同的,但其数据存放位置是任意的。外部表的真实数据不被Hive管理,即当删除. 张内部表时,元数据以及HDFS上的真实数据均被删除,而删除外部表则只会删除元数据面不会删除真实数据。RCFILE遵循“先水平划分,再垂直划分”的设计理念:首先把Hive表水平切分成多个行组,保证同一行的数据位于同一节点,其次在行组内按照“列”垂直切分,实现列与列的数据在磁盘上呈现为连续的存储块。RCFILE 存储格式如下所示。

2024-03-21 12:34:07 919

原创 Hive入门级教学

Hive 的元数据使用RDBMS存储,Hive 的数据存储在HDFS中,大部分数据查询由MapReduce完成。Hive 将用户的查询转换为一系列的 MapReduce 任务,并在 Hadoop 集群上执行这些任务,以实现对数据的处理和分析。而 Hive 则是基于 Hadoop 的分布式文件系统(HDFS),数据以文件的形式存储在多个节点上。总之,当我们使用Hive 时,操作接口采用类SQL语法,提高了快速开发的能力,避免了编写复杂的MapReduce任务,诚少了开发人员的学习成本,而且扩展很方便。

2024-03-21 11:53:41 1601 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除