一、Hive简介
Hive是一个基于HDFS和MapReduce的分布式数据仓库系统,以表的形式管理用户数据,用户只需要编写HQL语句就能够利用MR对存放在HDFS上的数据进行计算(Hive会将HQL语句自动转换为MR作业,提交给MR执行),降低了学习成本。此实验指导用户如何使用Hive提供的命令行客户端连接HiveServer,并通过HQL语句实现内部表、外部表、分区分桶表的创建、删除、修改、数据的导入导出、数据的查询等操作。
二、 Hive的安装
(1) 下载并解压hive源程序
直接在虚拟机中进入网址:hive源程序网址
下载Hive源程序
(2) 解压源程序
在终端输入下面命令:
sudo tar -zxvf ./apache-hive-1.2.1-bin.tar.gz -C /usr/local # 解压到/usr/local中
cd /usr/local/
sudo mv apache-hive-1.2.1-bin hive # 将文件夹名改为hive
sudo chown -R hadoop: hadoop hive # 修改文件权限
(3) 配置环境变量
为了方便使用,把hive命令加入到环境变量中去,使用vim编辑器打开.bashrc文件,命令如下:
vim ~/.bashrc
加入的内容为:
export HIVE_HOME=/usr/local/hive
export PATH=$PATH:$HIVE_HOME/bin
export HADOOP_HOME=/usr/local/Hadoop
保存退出后,运行如下命令使配置立即生效:
source ~/.bashrc
(4) 修改/usr/local/hive/conf下的hive-site.xml
执行如下命令:
cd /usr/local/hive/conf
mv hive-default.xml.template hive-default.xml
上面命令是将hive-default.xml.template重命名为hive-default.xml;然后,使用vim编辑器新建一个配置文件hive-site.xml,命令如下:
cd /usr/local/hive/conf
vim hive-site.xml
三、 安装并配置mysql
采用MySQL数据库保存Hive的元数据,而不是采用Hive自带的derby来存储元数据。
(1) 下载安装MySQL
使用以下命令即可进行mysql安装,注意安装前先更新一下软件源以获得最新版本:
sudo apt-get update #更新软件源
sudo apt-get install mysql-server #安装mysql
(2) 启动和关闭mysql服务器
service mysql start
service mysql stop
(3) 确认是否启动成功,mysql节点处于LISTEN状态表示启动成功
sudo netstat -tap |grep mysql
(4) 进入mysql shell界面
mysql -u root -p
四、 MySQL常用操作
MySQL中每个命令后都要以英文分号;结尾。
(1) 显示数据库
show databases;
(2) 显示数据库中的表
use mysql; //打开库,对每个库进行操作就要打开此库
showtables;
(3) 显示数据表的结构
describe 表名;
(4) 显示表中的记录
select * from 表名;
例如:显示mysql库中user表中的纪录。所有能对MySQL用户操作的用户都在此表中。
select * from