springboot中使用jdbc+impala+Kerberos+数据源查询hive

本文介绍了在Springboot应用中如何优化jdbc连接impala,包括通过Kerberos认证、自定义连接池以及在hive新建表后通过消息队列同步impala。详细讨论了Springboot启动时执行Kerberos认证的实现,并针对连接池配置遇到的问题提出自定义连接池的解决方案。
摘要由CSDN通过智能技术生成

在springboot中使用jdbc连接impala可以参照上一篇笔记java使用jdbc绕过Kerberos连接impala,此次是在上一篇的基础上进行优化。增加了数据库连接池与同步hive操作。

1. 同步hive

在本项目的实际应用场景中,会向hive中新建表,然后使用查询impala的方式获取hive中的数据。但是在实际的操作过程中发现,每次hive新建表后,需要在impala中进行同步操作才可以查询到新建的表。

同步操作很简单,jdbc连接impala成功后,执行下面sql即可。

INVALIDATE METADATA

后来又发现一个问题,就是在每次查询前都进行同步操作的话,那样是非常耗费时间与性能的操作,但是在hive中新建一个表的操作与查询impala不是同一个模块的工作,最后采用了消息队列的方式,当hive新建表完成后,会通过消息队列通知java模块进行impala同步hive的操作,这样就避免了每次查询impala都去同步数据库的操作。

2. Kerberos认证

此前采用每次获取impala的jdbc连接前都进行一次Kerberos认证的方式,但是每次都进行验证也是耗费时间与性能的,就想着能不能在某一次验证通过后,后续就无需再进行认证了。

后于Kerberos部署人员了解后,知道Kerberos认证的有效时间是24小时。也就是说我每24小时进行一次验证就可以了,那么最开始启动springboot服务的时候该如何通过认证呢?

Springboot启动时执行指定代码

我们在平时的springboot项目中会遇到在服务启动时期望其加载某些静态文件,或者服务启动时访问某些其他服务。这时候就需要在springboot中配置启动执行。

springboot为我们提供了两种开机启动的接口

  1. CommandLineRunner
  2. ApplicationRunner
  3. 同时我们也可以采用spring提供的监听事件ApplicationListener来实现 几种种方式都可以实现“开机启动”。
package com.mas.bgdt.dmp.data.report.config;

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.security.UserGroupInformation;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.CommandLineRunner;
import org.springframework.stereotype.Component;

import java.io.IOException;

/**
 * @Description springboot启动服务时跳过Kerberos认证
 * @Author LiuYue
 * @Date 2019/7/30
 * @Version 1.0
 */
@Slf4j
@Component
public class KerbersInit implements CommandLineRunner{
   

    @Value("${impala.kerb5}")
    private String krb5;
    @Value("${impala.keytab}")
    private String keyTab;

    private final String userName = "****";

    @Override
    public void run(String... args) throws Exception {
   

        System.setProperty("java.security.krb5.conf", krb5);

        Configuration configuration = new Configuration();
        configuration.set("hadoop.security.authentication","Kerberos");
        UserGroupInformation.setConfiguration(configuration);
        try {
   
            UserGroupInformation.loginUserFromKeytab(userName, keyTab);
            System.out.println(UserGroupInformation.getLoginUser());
        } catch (IOException e) {
   
            log.error("通过Kerberos认证失败",e);
        }
        log.info("通过Kerberos认证成功");
    }
}

这里使用的是实现CommandLineRunner接口的方式实现springboot启动完毕就进行Kerberos认证,为了避免中间认证丢失,还定义了一个定时任务,每隔12个小时重新进行一次认证。

package com.mas.bgdt.dmp.schedule;

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.security.UserGroupInformation;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.scheduling.annotation.<
Hue 是一个 Hadoop 生态圈的 Web 界面,它可以方便地管理和使用 Hadoop 生态圈的各种组件,包括 Impala。下面是使用 Hue 和 Impala 的简单教程: 1. 安装和配置 Impala 首先,需要在 Hadoop 集群安装和配置 Impala。具体的安装和配置步骤可以参考 Impala 官方文档。 2. 启动 Hue 启动 Hue 的命令如下: ``` $ sudo service hue start ``` 启动成功后,在浏览器输入 Hue 的 URL 地址,例如:`http://localhost:8888/`,进入 Hue 的登录页面。输入用户名和密码,点击登录即可进入 Hue 的主界面。 3. 创建 Impala 表 在 Hue 的主界面,点击左侧菜单栏的“Impala”选项,进入 Impala查询页面。在查询页面,输入 Impala 建表语句,例如: ``` CREATE TABLE my_table ( id INT, name STRING, age INT, gender STRING ) ``` 然后,点击“Execute”按钮,执行该语句,即可创建名为`my_table`的表。 4. 查询 Impala 表 在 Hue 的 Impala 查询页面,输入 Impala 查询语句,例如: ``` SELECT * FROM my_table; ``` 然后,点击“Execute”按钮,执行该语句,即可查询`my_table`表的数据。 5. 导入数据到 Impala 表 在 Hue 的 Impala 查询页面,可以使用 LOAD DATA 命令将数据导入到 Impala。例如: ``` LOAD DATA INPATH '/path/to/data' INTO TABLE my_table; ``` 6. 使用 Impala 高级功能 Hue 还提供了 Impala 的高级功能,例如:查询分析器、视图、UDF 等。在 Hue 的 Impala 查询页面,可以使用这些高级功能,从而更方便地管理和使用 Impala。 以上就是使用 Hue 和 Impala 的基本教程,Hue 还有很多其他的功能,可以根据需要进行学习和使用
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值