Hive基本介绍(1)

Hive基本概念

是一个基于hadoop的数据仓库工具,可以将结构化数据映射成一张数据表,并提供类SQL的查询功能。

Hive的意义是什么

  • 背景:hadoop是个好东西,但是学习难度大,成本高,坡度陡。
  • 意义(目的):降低程序员使用hadoop的难度。降低学习成本。

Hive可以对数据进行存储与计算

存储使用HDFS存储
计算使用MapReduce进行计算
Hive的特性

  • 1、扩展性 : Hive的扩展性与集群的扩展性相同
  • 2、延展性:Hive支持用户自定义函数,编写符合自己业务需求的函数。
  • 3、容错性:节点出现问题(宕机/断电)SQL仍可完成执行。

Hive缺点

每次的执行开销较大,任务运行时间较长,延时较高。

Hive的内部组成架构

在这里插入图片描述

  • 元数据:描述数据的数据(属性)
  • 表名称、字段名,字段的数据类型。
  • 内部执行流程:
    解释器 -> 编译器 -> 优化器 -> 执行器
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值