Hadoop + Hive 数据仓库原理与架构

最新推荐文章于 2024-06-22 19:52:27 发布

Wu_Candy

最新推荐文章于 2024-06-22 19:52:27 发布

阅读量2.2k

点赞数 2

分类专栏：大数据测试文章标签： hadoop hdfs yarn mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41754309/article/details/121419591

版权

本文介绍了Hive作为基于Hadoop的数据仓库工具，提供类SQL接口处理结构化数据，包括其映射机制、元数据管理和优点。还概述了Hive的架构，强调其将SQL转化为MapReduce任务的功能。此外，文章提到了Hive的扩展性和在大数据生态中的作用。

摘要由CSDN通过智能技术生成

1. Hive简介

Hive是什么

Hive 构建在 Hadoop 之上，提供以下功能：

通过类 SQL 指令轻松访问数据的工具，从而实现数据仓库任务，例如：提取/转换/加载(ETL)，报告和数据分析。
一种将结构强加于各种数据格式的机制。
直接访问存储在 HDFS 或其他数据存储系统（例如：HBase）中的文件。
通过Tez, Spark, MapReduce执行查询。
HPL-SQL的过程语言。
通过Hive LLAP, YARN, Slider进行亚秒级查询检索。

Hive 提供标准的 SQL 功能，Hive 的 SQL 也可以通过用户定义的函数(UDF)，用户定义的集合(UDAF)和用户定义的表函数(UDTF)扩展为用户代码。

换句话来说，Hive 是基于 Hadoop 的一个数据仓库工具，是用来管理数据仓库的。可以将结构化的数据文件映射为一张数据库表，并提供类 sql 的查询功能。

从如下 Hadoop 生态圈图中可以看出 Hive 所扮演的角色。

Hive如何将结构化的数据文件映射成一张表

结构化的数据文件如何理解？

数据文件中有固定的字段

最低0.47元/天解锁文章

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Wu_Candy CSDN认证博客专家 CSDN认证企业博客

码龄7年

303: 原创

3万+: 周排名

114万+: 总排名

43万+: 访问

: 等级

4927: 积分

249: 粉丝

202: 获赞

318: 评论

1600: 收藏

私信

关注

热门文章

分类专栏

最新评论

一文搞懂 Python 私有属性 & 私有方法
sesenb: 我靠，刚才看到用一个下划线定义私有的，给我看的怀疑人生了，赶紧过来看看，才发现我没记错，那哥们真TM是个人才，一个下划线定义私有他还觉得没毛病，写了一整篇代码，全都是这样定义，简直惨不忍睹
实战|轻松用 Python 开发一个简单有趣的聊天小程序
不和你玩儿了: 可以分享一下网络调试助手的安装包嘛
一文搞懂 Python 私有属性 & 私有方法
桂花树开，空气也变得香甜: 突然意识到一个问题，虽然可以通过普通方法间接访问私有变量和方法，但是具体实现细节不清楚。如果私有变量和方法可以随意访问，那python程序的安全性怎么保证啊？
一文搞懂 Python 私有属性 & 私有方法
桂花树开，空气也变得香甜: 看懂了，博主还是有思路的
一文搞懂 Python 私有属性 & 私有方法
桂花树开，空气也变得香甜: “(3). 从下图可以看出，在对象内部私有方法与私有属性是可以被调用的。”应该是在类内部私有方法和私有变量可以被调用吧。就算是该类创建的实例对象也不能调用该类的私有变量和方法。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Wu_Candy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。