数据仓库Hive的安装配置操作
1.教学目标
1 了解 hive 的工作原理;
2 掌握 hive 的安装配置启动操作
2.教学内容
1 掌握 hive 的安装操作;
2 掌握 hive 的启动操作 ;
3 掌握 hive的客户端操作
3.知识点
Hive依赖于Hadoop,实际存储是依赖于Hadoop的HDFS模块,计算依赖于Hadoop的Mapreduce模块。
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据映射为一张数据表,可以将SQL语句转化为MapReduce任务进行运行
4.实践步骤
1. 启动hdfs,启动Hadoop相关进程
bash start-dfs.sh
2. 将 hive 上传到 hdfs 服务器
将apache-hive-1.2.0-bin.tar.gz
安装包上传到hdfs服务器
3. 解压安装
cd /home/software
ls
运行截图:
tar -xvf apache-hive-1.2.0-bin.tar.gz
运行截图:
4. 重命名目录
ls
mv apache-hive-1.2.0-bin hive
运行截图:
5. 进入hive目录
cd hive
6. 进入hive\bin目录
ls
cd bin
7. 进入hive shell客户端
base hive
运行截图:
注意:可能会报错,见 5.2
8. 显示当前数据库
show databases;
运行截图:
注意:databases不要忘了s
9. 创建一个数据库
create database bigdata;
查看:
show databases;
运行截图:
5.报错
1.忘记启动dfs
启动hive之前要先启动hadoop集群
解决:
启动dfs
bash start-dfs.sh
2.未退出安全模式
解决:
hdfs dfsadmin -safemode leave
运行截图:
启动hive报错:Cannot create directory /tmp/hive. Name node is in safe mod-CSDN博客