数据仓库工具
数据仓库和数据库 是不一样的概念
数据库:针对数据的增删改查,业务性操作
数据仓库:存储日志数据或统计好的数据,主要用于分析数据、捕获数据、存储历史数据,多为报表 主要提供决策支持而非业务。进行数据提取、转化、加载,是一种可以存储,查询和分析,底层hdfs。使用近似的sql语句去操作hdfs和进行简单的mapreduce操作。一般来做的操作是增加和查询。mapreduce出来的结果存储在数据仓库
不同点:
数据内容的不一致
数仓一般不会修改源数据,数据库不一样(增删改)
目的性不一样,数据库为程序运行,数仓为决策支持
操作不一样,数据库增删改查,数仓分析处理(上端下端)
两者相辅相成关系,数据仓库主要面向主题设计。数据库主要面向事务的操作
1、下载,解压
hive-1.1.0-cdh5.15.1.tar hive版本要和hadoop版本一致
解压
tar -zxvf 压缩包名称
删除安装包
rm -fr 压缩包名称
2、修改配置文件
hive-env.sh
hive-site.xml
3、拷贝驱动jar包到lib文件夹中
修改hive-env.sh
在conf目录下
mv hive-env.sh.template hive-env.sh
编辑模式
修改HADOOP_HOME的位置 had