为什么要使用Hive

  • 简单、容易上手
  • 为超大数据集设计的计算/扩展能力
  • 统一的元数据管理
    Hive数据存放在HDFS上,元数据信息是存放在Mysql中,元数据{(表名字、表字段、表字段类型、存放在HDFS的位置)记录数据的数据。}

SQL on hadoop :Hive、Spark SQL、impala…

构建于Apache Hadoop之上,提供以下功能:

通过SQL轻松访问数据的工具,从而实现数据仓库任务,如提取/转换/加载(ETL),报告和数据分析。
一种在各种数据格式上强加结构的机制
访问直接存储在Apache HDFS 或其他数据存储系统(如Apache HBase )中的文件

通过Apache Tez , Apache Spark 或 MapReduce执行查询
使用HPL-SQL的过程语言
通过Hive LLAP,Apache YARN和Apache Slider进行亚秒级查询检索。

Hive在Hadoop生态系统中的位置
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值