大数据平台组件的安装,大家可以先在网上搜索,后期我会出一个安装过程图解,并支持HA的类生产环境的安装。
Hive是构建在hadoop平台上的大数据仓库,方便大数据平台的数据读写和离线计算。为了方便管理hive自己有一套元数据的管理数据库,默认是存放在derby数据库中,不过此方法不适合生产,因为每个用户登录hive都是在本地目录创建元数据信息,不适合统一管理,所以一般生产上我们是放到mysql中,具体可以见hive的环境的hive-site.xml文件信息。此文件在/app/hive-2.0.1/conf目录下,其中/app/hive-2.0.1/为你hive的主目录。
Hive-site.xml文件:
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
<description>Driver class name for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop100:3306/hive?createDatabaseIfNotExist=true</value>
<description>JDBC connect string for a JDBC metastore</description>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>hive</value>
<description>Username to