hive 3.1.2 环境搭建(使用mysql)以及示例运行

 ads:

关注以下公众号查看更多文章

hive目前最新版本为3.1.2,下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz

hadoop安装教程参考链接:hadoop3.2.1集群搭建

hadoop高可用配置,参考链接:hadoop 3.2.1 hdfs高可用集群搭建

在hadoop项目下执行以下几条命令:

bin/hdfs dfs -mkdir       /tmp
bin/hdfs dfs -mkdir -p    /user/hive/warehouse
bin/hdfs dfs -chmod g+w   /tmp
bin/hdfs dfs -chmod g+w   /user/hive/warehouse

conf/hive-env.sh

HADOOP_HOME=/home/software/hadoop-3.2.1
export HIVE_CONF_DIR=/home/software/hive-3.1.2/conf

HIVE_AUX_JARS_PATH

hive-log4j.properties: hive.log.dir

hive-site.xml

<configuration>
    <property>
          <name>hive.metastore.uris</name>
          <value>thrift://mustafa-PC:9083</value>
    </property>
    <property>
        <name>hive.metastore.warehouse.dir</name>
        <value>/user/hive/warehouse</value>
    </property>
    <property>
        <name>hive.exec.compress.intermediate</name>
        <value>true</value>
    </property>
    <property>
      <name>hive.fetch.task.conversion</name>
      <value>more</value>
    </property>
    <property>
      <name>hive.auto.convert.sortmerge.join</name>
      <value>true</value>
    </property>
    <property>
      <name>hive.auto.convert.join</name>
      <value>true</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionURL</name>
        <value>jdbc:mysql://172.17.0.3:3221/hive</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionDriverName</name>
        <value>com.mysql.jdbc.Driver</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionUserName</name>
        <value>hive</value>
    </property>
    <property>
        <name>javax.jdo.option.ConnectionPassword</name>
        <value>hive</value>
    </property>
    <property>
        <name>hive.cli.print.header</name>
        <value>true</value>
    </property>
    <property>
        <name>hive.cli.print.current.db</name>
        <value>true</value>
    </property>
</configuration>

另外,需要在lib目录中放入mysql驱动:mysql-connector-java-5.1.42-bin.jar

初始化mysql数据库:

schematool -dbType mysql -initSchema

启动metastore

bin/hive --service metastore &

bin/hive进入hive命令行,执行语句:

create database if not exists hadoop14;
use hadoop14;
create table student (
num int, name string
)
row format delimited fields terminated by '\t'
;
load data local inpath 'student.txt' into table student;
select * from student;

踩坑之路:

Exception in thread "main" java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkArgument(ZLjava/lang/String;Ljava/lang/Object;)V
 

这是因为hive内依赖的guava.jar和hadoop内的版本不一致造成的。 检验方法:

  1. 查看hadoop安装目录下share/hadoop/common/lib内guava.jar版本
  2. 查看hive安装目录下lib内guava.jar的版本 如果两者不一致,删除版本低的,并拷贝高版本的 问题解决!

修改mysql中hive库里的表的某些字段字符集设置,避免在hive中设置的中文注释有乱码(很重要!!)
使用hive用户登录mysql服务的命令行,执行如下命令

#修改hive元数据表中注解相关字段为utf8:
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_PARAMS modify column PARAM_VALUE?varchar(4000) character set utf8 ;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
要在Ubuntu 20.04上使用Hive 3.1.2连接MySQL 8.0.33,您需要按照以下步骤操作: 1. 安装MySQL 8.0.33 您可以按照MySQL官方文档的指导来安装MySQL 8.0.33。安装完成后,请确保MySQL服务正在运行。 2. 安装Hive 3.1.2 您可以从Hive官网下载Hive 3.1.2压缩包,然后解压到您喜欢的目录下。建议将Hive目录添加到PATH环境变量中。 3. 配置HiveHive目录下,找到conf目录,将hive-env.sh.template文件复制一份并重命名为hive-env.sh。编辑hive-env.sh文件,将以下行添加到文件末尾: ``` export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:/path/to/mysql-connector-java-8.0.33.jar ``` 将/path/to/mysql-connector-java-8.0.33.jar替换为您实际安装MySQL Connector/J驱动程序的路径。 4. 配置Hive元存储 Hive使用元存储来存储元数据,例如表和列的信息。您可以使用Derby或MySQL作为元存储。在此示例中,我们将使用MySQL作为元存储。 - 创建MySQL元存储数据库和用户 登录到MySQL服务器,创建一个新的数据库和用户: ``` CREATE DATABASE metastore_db; CREATE USER 'hive'@'localhost' IDENTIFIED BY 'password'; GRANT ALL PRIVILEGES ON metastore_db.* TO 'hive'@'localhost'; ``` 将password替换为您选择的密码。 - 初始化元存储 在Hive目录下执行以下命令来初始化元存储: ``` schematool -initSchema -dbType mysql ``` 您需要在命令中提供MySQL连接信息和元存储数据库名称。例如: ``` schematool -initSchema -dbType mysql -url jdbc:mysql://localhost:3306/metastore_db?createDatabaseIfNotExist=true -user hive -password password ``` 这将创建必要的表格和元存储数据库。 5. 测试连接 运行以下命令来启动Hive CLI: ``` hive ``` 在Hive CLI中,运行以下命令来测试连接: ``` show databases; ``` 如果一切正常,您应该能够看到Hive CLI中可用的数据库列表,其中包括您之前创建的元存储数据库metastore_db。 6. 创建连接到MySQL的表 您可以使用Hive CLI或Hive的Web界面等工具来创建连接到MySQL的表格。下面是一个示例: ``` CREATE EXTERNAL TABLE mysql_table ( id INT, name STRING ) STORED BY 'org.apache.hadoop.hive.jdbc.storagehandler.JdbcStorageHandler' TBLPROPERTIES ( "mapred.jdbc.driver.class"="com.mysql.jdbc.Driver", "mapred.jdbc.url"="jdbc:mysql://localhost:3306/test", "mapred.jdbc.username"="root", "mapred.jdbc.password"="password", "mapred.jdbc.input.table.name"="test_table" ); ``` 这将创建一个名为mysql_table的外部表,该表连接到MySQL服务器上的test数据库中的test_table表格。 希望这些步骤可以帮助您在Ubuntu 20.04上使用Hive 3.1.2连接MySQL 8.0.33。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fanghailiang2016

扔个包子砸我一下吧~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值