Hive编程指南

最新推荐文章于 2022-12-26 20:01:00 发布

Bwcx_Adam

最新推荐文章于 2022-12-26 20:01:00 发布

阅读量337

点赞数

分类专栏：读书笔记文章标签： hive hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Bwcx_Adam/article/details/120759622

版权

1. 基础知识

Hadoop实现了一个特殊的计算模型，即MapReduce

MapReduce可以将计算任务分割成多个处理单元然后分散到一群家用的或服务器级别的硬件机器上，从而降低成本并提供水平可伸缩性

MapReduce模型下，是一个成为Hadoop分布式文件系统（HDFS）的分布式文件系统

Hive提供一个称为Hive查询语言（HiveQL或HQL）的SQL方言，用来查询Hadoop集群中的数据

Hive的缺陷：

Hive不是一个完整的数据库，它不支持记录级别的更新、插入或者删除的操作
Hive是一个面向批处理的系统，它的查询延时比较严重
Hive不支持事务

Hive优势：它是最适合数据仓库应用程序的，其可以维护海量数据，而且可以对数据进行挖掘。然后形成意见和报告

1.1 Hadoop和MapReduce综述

MapReduce是一种计算模型。它可以将大型数据处理任务分解成很多单个的，可以在服务器集群中并行执行的任务。这些任务的计算结果，合并在一起可以用来计算最终结果。

MapReduce即：Map过程 + Reduce过程

Map过程：将集合中的元素从一种形式转换成另一种形式。

输入和输出的键必须完全不同，而输入和输出的值则可能完全不同

Reduce过程：将值的集合转换成一个值（例如对一组数值求和或求平均值），或转换成另一个集合

1.2 Hadoop生态系统中的Hive

Hive最适合于数据仓库程序，

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive编程指南

1. 基础知识Hadoop实现了一个特殊的计算模型，即MapReduceMapReduce可以将计算任务分割成多个处理单元然后分散到一群家用的或服务器级别的硬件机器上，从而降低成本并提供水平可伸缩性MapReduce模型下，是一个成为Hadoop分布式文件系统（HDFS）的分布式文件系统Hive提供一个称为Hive查询语言（HiveQL或HQL）的SQL方言，用来查询Hadoop集群中的数据Hive的缺陷：Hive不是一个完整的数据库，它不支持记录级别的更新、插入或者删除的操作 H
复制链接

扫一扫

专栏目录

Bwcx_Adam CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

114万+: 周排名

213万+: 总排名

2026: 访问

: 等级

80: 积分

1: 粉丝

0: 获赞

0: 评论

3: 收藏

私信

关注

热门文章

分类专栏

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。