【Hive】概念、优缺点及使用场景

在这里插入图片描述


概念
         Hive是构建与Hadoop之上的数据仓库软件,能够有效的读取、写入和管理大型数据集合, 并且支持通过SQL查询分析数据。(Hive是基于Hadoop的,Hadoop数据处理任务本质上是 MapReduce,所以HiveSQL执行本质上都是MapReduce任务)。
优缺点比较

优点缺点
1、可以通过SQL完成ETL(抽取/转换/加载)任务、生成报表、以及数据分析。
2、避免复杂的MapReduce的开发,能够节省大量开发成本 Hive本质上作为一个工具,能够支持多种数据分析引擎。
3、Hive可以支持Hadoop的MapReduce分析引擎,也可以支持Spark等分析引擎。
4、Hive提供JDBC服务,可以通过JDBC连接Hive操作HDFS数据,并且可以整合多种BI可视化工具,Hive可以通过元数据直接访问HDFS上的数据。
5、Hive能够支持多种数据类型和文件格式 。
6、Hive支持自定义函数,用户可以根据需求定义自己的函数进行扩展
1、Hive不支持事务操作
2、HiveSQL本身表达能力有限,不能够进行迭代式计算以及数据挖掘
3、Hive操作默认基于MapReduce引擎,延迟比较高不适用于交互式查询。并且基于SQL调优困难

使用场景
  1. Hive可构建基于Hadoop的数据仓库
  2. Hive适合大数据集的批处理作业,比如行为日志分析、多维数据分析
  3. 海量结构化数据离线分析

本节完!

*更多信息交流请加QQ:1958917311*
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值