HIVE是基于Hadoop的一个数据仓库,可以将结构化的数据文件映射成一张表,并提供类SQL的查询语句,其SQL操作的基本原理是MapReduce,在本文最后的例子中,可以发现在某些操作时,Hive SQL其实是调用了MapReduce过程进行处理,因此使用Hive可以完成数据处理的操作,避免编写MapReduce的业务逻辑,提高开发效率。
其实大部分数据库都是以文件映射的形式保存到磁盘中,对外提供SQL操作,然后通过业务逻辑去磁盘中读写对应的数据。Hive的数据是保存在HDFS中的,元数据等信息是保存到mysql中,因此安装Hive需要依赖mysql.
Linux中安装mysql5.6
- 查找当前的Linux系统中是否有mysql及其依赖,如有则需要删除
# rpm -qa | grep mysql
# sudo yum -y remove mysql-libs.x86_64
- 设置rpm安装源,前提需要安装
wget
# wget dev.mysql.com/get/mysql-community-release-el6-5.noarch.rpm
# sudo yum localinstall mysql-community-release-el6-5.noarch.rpm
- 查看需要安装的版本,本例安装mysql5.6版本。其中enable=1表示要安装的,enable=0表示不安装。
查看命令:
# yum repolist enabled | grep mysql
配置安装,通过以下命令修改文件可设置需要安装的版本。
# vi /etc/yum.repos.d/mysql-community.repo
- 安装
# yum -y install mysql-server mysql
- 启动
# service mysqld start
# 设置开机启动
# chkconfig mysqld on
如果启动失败,报错文件写入的问题。第一个命令是查看SELinux是否启动,第二个命令是关闭SELinux。