hive总结

最新推荐文章于 2024-07-19 17:03:30 发布

参丛iis

最新推荐文章于 2024-07-19 17:03:30 发布

阅读量125

点赞数

分类专栏：大数据框架文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30889993/article/details/89979434

版权

大数据框架专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、前提

在hadoop集群中一台机器安装hive，熟悉常用指令。

二、了解hive

1.hive是什么？

hive是facebook开源的应用于处理分析大量数据的数据仓库，hive封装了很多mapreduce的mr模型，客户端可以通过hql经过hive的匹配到mr模型，mr运算的结果返回给客户端。

hive的数据存放在hdfs，计算是mr，运行在yarn上，hive是数据结构的一种表映射关系，可以通过表查看数据，进行统计分析，但是延迟高，不适合做实时查看。

2.为什么用hive？

hql类似于sql，不用写mr程序，简单可适用范围广，延迟高，可处理大量数据，可灵活自定义函数

3.hive与数据库的区别

数据存放地点：一个hdfs；一个是本地文件系统或块数据

数据的更新：hive数据读多写少，所有数据在加载时都确定好了；数据库数据经常更新

索引：hive在加载中不过对数据进行处理，不需要对某些key加索引，要访问某些特定数据，需要暴力扫描整个数据，访问延迟高，mr引入，可以并行处理，仍然可以接受。数据库会对一个或者几个列建立索引，访问速度快，延迟低

执行引擎：hive时mr，数据库有自己的执行引擎

可扩展性：hive是依赖于hadoop，扩展性是一致的，数据库扩展是有瓶颈的

数据规模：hive是运行于集群上的，可并行计算，数据库规模很小

三、主要用法

hql编写

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive总结

一、前提在hadoop集群中一台机器安装hive，熟悉常用指令。二、了解hive1.hive是什么？hive是facebook开源的应用于处理分析大量数据的数据仓库，hive封装了很多mapreduce的mr模型，客户端可以通过hql经过hive的匹配到mr模型，mr运算的结果返回给客户端。hive的数据存放在hdfs，计算是mr，运行在yarn上，hive是数据结构的一种表映...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。