Hive之快速入门以及安装部署

1.生产中常使用的SQL on hadoop 框架

主流sql on hadoop有Hive、Spark SQL、Phonix

扩展1:hadoop 由hdfs,yarn,mr组成,守护进程nn与rm容易出现单点故障,而生产中要求是任何一个流程都要考虑到单点故障,任何一个组件环节都必须是HA(高可用),生产中nn,rm都至少两个,实时热备。

2.Hive简介

Hive是Apache基金会的一个开源顶级的项目,官网:hive.apache.org。

Hive是数据仓库,由Facebook贡献,使用SQL进行大数据的处理和分析

Hive可管理的分布式存储:HDFS/S3等

Hive可底层执行引擎:MR(Apache2.0过时)、spark 、Tez

Hive运行在yarn等

扩展1:如果一个框架最终不能落地SQL,那么这个框架就有待选择。

扩展2:hvie源码位置:github.com/apache/hive ,任何一个人都可成为源码的con

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值