springboot中使用jdbc+impala+Kerberos+数据源查询hive

最新推荐文章于 2024-09-22 01:40:45 发布

nb7474

最新推荐文章于 2024-09-22 01:40:45 发布

阅读量8k

点赞数 1

分类专栏： springboot impala 文章标签： springboot impala 连接池 jdbc

本文链接：https://blog.csdn.net/nb7474/article/details/97949751

版权

本文介绍了在Springboot应用中如何优化jdbc连接impala，包括通过Kerberos认证、自定义连接池以及在hive新建表后通过消息队列同步impala。详细讨论了Springboot启动时执行Kerberos认证的实现，并针对连接池配置遇到的问题提出自定义连接池的解决方案。

摘要由CSDN通过智能技术生成

在springboot中使用jdbc连接impala可以参照上一篇笔记java使用jdbc绕过Kerberos连接impala,此次是在上一篇的基础上进行优化。增加了数据库连接池与同步hive操作。

1. 同步hive

在本项目的实际应用场景中，会向hive中新建表，然后使用查询impala的方式获取hive中的数据。但是在实际的操作过程中发现，每次hive新建表后，需要在impala中进行同步操作才可以查询到新建的表。

同步操作很简单，jdbc连接impala成功后，执行下面sql即可。

INVALIDATE METADATA

后来又发现一个问题，就是在每次查询前都进行同步操作的话，那样是非常耗费时间与性能的操作，但是在hive中新建一个表的操作与查询impala不是同一个模块的工作，最后采用了消息队列的方式，当hive新建表完成后，会通过消息队列通知java模块进行impala同步hive的操作，这样就避免了每次查询impala都去同步数据库的操作。

2. Kerberos认证

此前采用每次获取impala的jdbc连接前都进行一次Kerberos认证的方式，但是每次都进行验证也是耗费时间与性能的，就想着能不能在某一次验证通过后，后续就无需再进行认证了。

后于Kerberos部署人员了解后，知道Kerberos认证的有效时间是24小时。也就是说我每24小时进行一次验证就可以了，那么最开始启动springboot服务的时候该如何通过认证呢？

Springboot启动时执行指定代码

我们在平时的springboot项目中会遇到在服务启动时期望其加载某些静态文件，或者服务启动时访问某些其他服务。这时候就需要在springboot中配置启动执行。

springboot为我们提供了两种开机启动的接口

CommandLineRunner
ApplicationRunner
同时我们也可以采用spring提供的监听事件ApplicationListener来实现几种种方式都可以实现“开机启动”。

package com.mas.bgdt.dmp.data.report.config;

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.security.UserGroupInformation;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.CommandLineRunner;
import org.springframework.stereotype.Component;

import java.io.IOException;

/**
 * @Description springboot启动服务时跳过Kerberos认证
 * @Author LiuYue
 * @Date 2019/7/30
 * @Version 1.0
 */
@Slf4j
@Component
public class KerbersInit implements CommandLineRunner{
   

    @Value("${impala.kerb5}")
    private String krb5;
    @Value("${impala.keytab}")
    private String keyTab;

    private final String userName = "****";

    @Override
    public void run(String... args) throws Exception {
   

        System.setProperty("java.security.krb5.conf", krb5);

        Configuration configuration = new Configuration();
        configuration.set("hadoop.security.authentication","Kerberos");
        UserGroupInformation.setConfiguration(configuration);
        try {
   
            UserGroupInformation.loginUserFromKeytab(userName, keyTab);
            System.out.println(UserGroupInformation.getLoginUser());
        } catch (IOException e) {
   
            log.error("通过Kerberos认证失败",e);
        }
        log.info("通过Kerberos认证成功");
    }
}

这里使用的是实现CommandLineRunner接口的方式实现springboot启动完毕就进行Kerberos认证，为了避免中间认证丢失，还定义了一个定时任务，每隔12个小时重新进行一次认证。

package com.mas.bgdt.dmp.schedule;

import lombok.extern.slf4j.Slf4j;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.security.UserGroupInformation;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.scheduling.annotation.<