-
Hive是什么?
hive是一个开源的用于大数据分析和统计的数据库工具,它的存储基于HDFS,计算基于MapReduce或Spark,可以将结构化数据映射成表,并提供类SQL查询功能。
-
Hive的特点:
提供类SQL查询,容易上手,开发方便
封装了很多方法,尽量避免了开发MapReduce程序,减少成本
支持自定义函数,可以根据需求实现函数
适用于处理大规模数据,小数据的处理没有优势
执行延迟较高,适合用于数据分析,不适合对时效性要求较高的场景
-
Hive的安装与配置详解
准备:打开三台虚拟机,并且连接好xshell
1.传输apache-hive-2.3.3-bin.tar.gz(hive官网地址:https://hive.apache.org/,下载对应版本即可)压缩包文件到/opt/software目录下,如下图所示:
可以使用rz命令,选择路径上传,也可以直接把文件从本地拖拽致xshell内,也可以使用xftp来传输。
2.解压apache-hive-2.3.3-bin.tar.gz 到指定文件夹目录下
修改文件夹名,此步骤可忽略:
3.在/opt/software/hive-2.3.3/lib目录下上传mysql连接包,(下载地址:https://downloads.mysql.com/archives/c-j/) 4.在Hive的conf目录下下添加以下配置信息: