【大数据】Hive
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制
老王的小知识
爱分享的老王
展开
-
Hive知识点总结--持续更新
什么是HiveHive是基于Hadoop的一个数据仓库工具,是将结构化数据文件映射称为一个数据表,并提供类SQL的查询功能Hive的意义(最初研发的原因)在Hadoop是个好软件,但是不好使用(学习成本高,坡度陡,难度大)的前提下降低了程序员使用Hadoop的学习成本,降低了难度或避免了去写MapReduce,提供快速开发的能力,减少开发人员的学习成本Hive内部组成模块及作用...原创 2020-02-06 01:02:56 · 2411 阅读 · 0 评论 -
Hive的安装部署与环境变量等配置(三种安装部署方式)
1.Derby版Hive直接使用(不推荐)默认使用derby(数据库)维护元数据缺点:此版本,在每个节点自己独立维护一个derby数据库,即在节点1添加了数据库,则在节点2无法查看(多个节点安装hive后,每个hive拥有一套自己的元数据,各个节点的库、表不同步)解压Hivecd /export/softwarestar -zxvf hive-1.1.0-cdh5.14.0.tar.gz...原创 2019-11-20 00:16:41 · 3741 阅读 · 0 评论 -
初识Hive-基本概念
1.什么是HiveHive是一个基于Hadoop的一个数据仓库工具,是将结构化数据文件映射成为一个数据表,并提供类SQL的查询功能2.Hive可以对数据进行存储与计算(与Hadoop关系)数据存储依赖于HDFS数据计算依赖于MapReduce3.Hive的意义(目的)在Hadoop是个好软件,但不好使用(学习成本高,坡度陡,难度大)的前提下降低了程序员使用Hadoop的学习成本,降...原创 2019-11-19 23:53:17 · 2306 阅读 · 0 评论