hive

最新推荐文章于 2022-04-08 00:11:07 发布

zixu_star

最新推荐文章于 2022-04-08 00:11:07 发布

阅读量110

点赞数

本文链接：https://blog.csdn.net/dshizixu/article/details/103236551

版权

本文介绍了Hive的基本概念，包括其数据存储在HDFS，利用MapReduce进行分析，以及如何在大规模数据上运行。详细步骤涵盖了Hive的安装、部署，以及将Hive元数据配置到MySql的过程。还涉及到MySql的安装、启动，以及HiveJDBC的访问和对表的操作。

摘要由CSDN通过智能技术生成

hive(操作数据库一定要带==;==)

实质：将HQL转化成MapReduce程序
1）Hive处理的数据存储在HDFS
2）Hive分析数据底层的实现是MapReduce
3）执行程序运行在Yarn上
数据存储位置
Hive 是建立在 Hadoop 之上的，所有 Hive 的数据都是存储在 HDFS 中的。而数据库则可以将数据保存在块设备或者本地文件系统中。
执行
Hive中大多数查询的执行是通过 Hadoop 提供的 MapReduce 来实现的。而数据库通常有自己的执行引擎。
数据规模
由于Hive建立在集群上并可以利用MapReduce进行并行计算，因此可以支持很大规模的数据；对应的，数据库可以支持的数据规模较小。

关注