Hive_1.2.1安装配置



安装Hive前需先安装Hadoop,可参考文章:Hadoop_2.7.2安装配置

1、下载安装包
方式一、从官网下载:https://hive.apache.org
方式二、从CSDN资源快速下载:快速下载Hive安装包

2、上传压缩包
将压缩包上传到/usr/local/software/

3、解压到/usr/local/目录下
tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /usr/local/

4、重命名
mv apache-hive-1.2.1-bin/ hive

5、新建配置文件
将conf目录下的hive-env.sh.template复制一份为hive-env.sh
cp hive-env.sh.template hive-env.sh

6、修改配置文件

#HADOOP_HOME路径
export HADOOP_HOME=/usr/local/hadoop-2.7.2
#HIVE_CONF_DIR路径
export HIVE_CONF_DIR=/usr/local/hive/conf

7、拷贝Mysql连接驱动包
将mysql驱动jar包复制到hive/lib目录下,jar包下载地址:https://download.csdn.net/download/mcajax/12149487
(下载后解压即可得到mysql驱动jar包)

8、将元数据配置到Mysql
在hive/conf目录下新建hive-site.xml
添加内容:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
	<property>
	  <name>javax.jdo.option.ConnectionURL</name>
	  <value>jdbc:mysql://bigdata102:3306/metastore?createDatabaseIfNotExist=true</value>
	  <description>JDBC connect string for a JDBC metastore</description>
	</property>

	<property>
	  <name>javax.jdo.option.ConnectionDriverName</name>
	  <value>com.mysql.jdbc.Driver</value>
	  <description>Driver class name for a JDBC metastore</description>
	</property>

	<property>
	  <name>javax.jdo.option.ConnectionUserName</name>
	  <value>root</value>
	  <description>username to use against metastore database</description>
	</property>

	<property>
	  <name>javax.jdo.option.ConnectionPassword</name>
	  <value>123456</value>
	  <description>password to use against metastore database</description>
	</property>
</configuration>

9、修改数据仓库位置
在hive-site.xml中添加以下内容

<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
<description>location of default database for the warehouse</description>
</property>

10、配置Hdfs中文件夹访问权限
hdfs dfs -chmod 777 /user/hive/warehouse

11、展示当前库及表头配置
在hive-site.xml中添加以下内容:

<property>
	<name>hive.cli.print.header</name>
	<value>true</value>
</property>

<property>
	<name>hive.cli.print.current.db</name>
	<value>true</value>
</property>

12、关闭元数据检查(可选)
在hive-site.xml中添加以下内容:

<property>
    <name>hive.metastore.schema.verification</name>
    <value>false</value>
</property>

13、配置环境变量
在/etc/profile中添加以下内容:

#hive
export HIVE_HOME=/usr/local/sqoop-1.4.6
export PATH=$PATH:$HIVE_HOME/bin

source /etc/profile

14、初始化元数据
hive/bin/schematool -dbType mysql -initSchema

若初始化元数据失败,则可能是元数据已经存在,可删除重新生成:
(1)查找metastore目录位置:find / -name metastore,本机路径为:/var/lib/mysql/metastore
(2)删除metastore目录
(3)再次执行上面命令刷新元数据

15、启动hive
hive

16、查看hive数据库默认编码
hive的元数据存在Mysql数据库的metastore库中
查看Hive库编码格式

mysql> show create table columns_v2;

在这里插入图片描述

17、修改编码格式防止中文乱码
(1)字段注释

mysql> alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

(2)表注释

mysql> alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

(3)分区字段注释

mysql> alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
mysql> alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

(4)索引注释

mysql> alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Hive 1.2.1是Apache Hive的一个版本,它是一个基于Hadoop的数据仓库工具。Hive允许用户使用类似SQL的查询语言HiveQL来查询和分析大规模数据。 JDBC(Java Database Connectivity)是Java编程语言用于与数据库进行连接和交互的API。它提供了一组类和接口,用于执行SQL语句、访问和操纵数据库。JDBC驱动是一种软件组件,它允许Java应用程序通过JDBC API连接到特定数据库系统,如HiveHive 1.2.1提供了基于JDBC的驱动程序,用于支持Java应用程序与Hive数据库的交互。这个驱动程序允许开发人员使用Java编程语言连接到Hive服务、执行查询和修改操作、获取查询结果等。 使用Hive 1.2.1的JDBC驱动,开发人员可以通过编写Java代码来连接到Hive,执行HiveQL查询,并处理返回的结果。它提供了一种灵活和强大的方式来访问和操作Hive数据库中的数据。 要使用Hive 1.2.1的JDBC驱动,首先需要将驱动程序的JAR文件添加到Java应用程序的类路径中。然后,可以使用JDBC API编写代码来建立与Hive的连接、执行查询和操作,最后关闭连接。 总而言之,Hive 1.2.1的JDBC驱动是一个重要的工具,它使得Java开发人员能够通过编写代码与Hive数据库进行交互,执行查询和操作,并获取结果。这样,开发人员可以更轻松地使用Java编程语言来处理和分析大规模的数据。 ### 回答2: Hive 1.2.1的JDBC驱动是用于连接Hive分布式数据仓库的Java程序接口。它是一个开放源代码的驱动程序,旨在允许用户通过Java编程语言与Hive数据库进行交互。 Hive是一个基于Hadoop的数据仓库基础设施,它提供了类似于SQL的查询语言HQL来处理大规模的数据集。Hive的设计灵感来自于关系型数据库,因此它允许用户使用SQL语法来查询和分析存储在Hadoop集群中的数据。 Hive 1.2.1的JDBC驱动提供了一个标准的接口,允许Java开发人员使用JDBC API与Hive进行通信。通过使用这个驱动程序,开发人员可以通过编写Java代码来执行查询、插入和更新操作,以及执行其他与Hive相关的任务。 使用JDBC驱动程序的好处是,它提供了一个通用的方式与Hive进行交互,无论是通过命令行还是通过编程方式。它还提供了连接池的支持,可以帮助管理连接的创建和释放,以提高性能和资源利用率。 Hive 1.2.1的JDBC驱动是通过向HiveServer2发送查询请求和接收结果来实现的。它通过使用底层的Thrift协议与HiveServer2进行通信,以提供高效的数据传输和查询执行。此外,它还提供了一些可选的配置参数,以便用户根据需要对连接和查询进行调整。 总结来说,Hive 1.2.1的JDBC驱动是一个用于连接Hive分布式数据仓库的Java程序接口。它允许Java开发人员使用JDBC API与Hive进行通信,执行查询和操作数据。通过使用这个驱动程序,开发人员可以更方便地与Hive集群进行交互,并实现更复杂的数据分析和查询任务。 ### 回答3: Hive是一个基于Hadoop的数据仓库工具,它允许用户对存储在Hadoop集群中的数据进行查询和分析。Hive提供了一种类似于传统数据库的SQL语言——HiveQL的查询语言,使得非技术人员也可以轻松地利用Hadoop进行数据分析。 Hive的JDBC驱动是用于连接Hive和其他应用程序,以便进行数据交互和查询的工具。Hive的JDBC驱动允许开发人员使用Java编程语言来访问和操作Hive数据库,从而实现数据的输入、输出和查询。 Hive的JDBC驱动提供了一系列的API和工具,使得开发人员可以编写Java程序来连接Hive数据库并执行各种操作,例如创建、删除和查询表,插入和更新数据等。开发人员可以使用JDBC驱动提供的接口和方法,通过建立与Hive服务器的连接,将Hive数据库纳入到他们的应用程序中。 使用Hive的JDBC驱动,开发人员可以利用Hive提供的丰富功能,如分区、存储格式和桶等,对海量数据进行处理和分析。同时,JDBC驱动还可以与其他工具和框架结合使用,如Spring等,进一步扩展和优化应用程序的功能。 总之,Hive的JDBC驱动是一种非常有价值的工具,它使得开发人员能够使用Java编程语言连接和操作Hive数据库,实现与Hadoop集群的数据交互和查询。通过JDBC驱动,开发人员可以更加灵活、高效地利用Hive进行数据分析和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值