Hive简介以及原理

Hive是一个基于Hadoop的数据仓库工具,提供类SQL接口处理HDFS上的结构化数据。它不支持记录级别的增删改操作,适合离线批量数据计算。Hive的架构分为用户接口、跨语言服务、Driver和数据存储四层,元数据通常存储在MySQL中。其优点包括可扩展性、自定义函数和良好的容错性,但查询延迟高,不适合交互查询。Hive中的表分为内部表和外部表,具有分区和分桶功能,用于数据管理。
摘要由CSDN通过智能技术生成

Hive简介

Hive是用来干什么的?有什么作用?
Hive来源是由脸书实现并开源
是一个基于Hadoop的一个数据仓库,底层数据在Hdfs之上。
可以使用Hve更方便的使用Hql处理和计算HDFS上的结构化的数据,使用与离线的批量数据计算.
Hive可以提供Hql查询功能,可以将数据映射为一张表,Hive本质是将sql语句转换为MapReduce来运行。
Hive 依赖与HDFS存储数据,Hive将Hql转换成MapReduce执行,所以说Hive是基于Hadoop的一个数据仓库工具,是指计算一款基于Hdfs的MapReduce计算框架,对存储在Hdfs中的数据镜像分析和管理。
在这里插入图片描述

使用Hive的原因

果直接使用MapReduce所面临的问题
1:人员成本过高
2:项目周期过短
3:MapReduce实现复杂查询逻辑开发难度过大

为什么使用Hive

1:有好的接口,操作接口采用类SQL的语法,提供快速开发的能力,节省时间
2:学习成本低,避免写MapReduce,减少人员学习成本
3:有更好的扩展性,可自由扩展规模而无重启服务,可以支持用户自定义函数

Hive特点(优点,缺点)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值