Hive的安装部署
一:首先了解以下Hive与关系型数据的区别:
1,他俩的存储文件的系统不同,hive使用的是HDFS(Hadoop的分布式文件系统),而关系数据库使用的是自己本地的文件系统
2,Hive使用的计算模型是Mapreduce,而数据库使用的是自己本身的计算模型
3,关系型数据库是为了实时查询业务进行设计的,例如Mysql中的触发器,而Hive则是为了海量数据的挖掘进行设计的,实时性很差,所以他俩的应用场景和关系型数据库有很大的不同
4,Hive很容易扩展自己的存储能力和计算能力,这是继承Hadoop的,这方面比关系数据库要强很多,例如在hive中可以设置很多reduce这样就可以多台服务器同时计算存储一个数据库
二:安装部署
1,首先安装mysql数据库(默认情况下hive使用自己的数据库Derby,但是只能提供有限的弹进程存储服务,所以在通常的开发,测试环境中,对于生产环境,需要使用mysql或者类似的关系型数据库)
Sudo apt-get install mysql-server
启动mysql服务
Sudo usermod -d /var/lib/mysql/ mysql
Sudo server mysql start
Mysql -uroot -p123456
2,创建hive数据库
Create database hiva;
Show databases;
3,退出mysql
Exit myaql;
1,安装hive
首先创建你要下载hive的文件夹
Sudo mkdir /opt/hive
设置这个文件夹的权限
Sudo chown -r ubuntu:ubuntu /opt/hiva
查看目录 ll
然后进入目录进行下载
Cd /opt/hive
Wget http://10.90.3.2/LMS/hadoop/hive/apache-hive-2.3.4-bin.tar.gz
解压文件
Tar -xzf apache-hive-2.3.4-bin.tar.gz
然后将mysql的驱动下载到hive的lib的目录下
Cd /opt/hive/apache-hive-2.3.4-bin/lib
Weget http://10.90.3.2/LMS/hadoop/hive/mysql-connector-java-5.1.46-bin.jar
因为hive要使用mysql这个数据库所以要在自己的lib目录下下载mysql的驱动这样才能进行使用
接下来在安装hive的文件夹路径下配置环境变量
打开etc/bash.bashrc路径
Sudo vim /etc/bash.bashrc
设置参数
使这些配置文件生效
Source /etc/bash.bashrc
设置hive-site.xml文件(用来当作插入数据时中转和存放用户名和操作权限使用)
设置数据库连接的路径
Jabc:mysql://localhost:3306/hive?useSSL=false
设置数据库连接驱动
Com.mysql.jabc.Driver
设置连接数据库的用户名和密码
Roor
123456
这点和navicat这个软件与数据库连接的方式相似
配置完成;