java之将hive中的数据批量写入到mysql中（代替sqoop工具）

最新推荐文章于 2024-04-29 14:28:16 发布

榴芒姐姐

最新推荐文章于 2024-04-29 14:28:16 发布

阅读量1.1k

点赞数 1

文章标签： java mybatis 连接池 hive mysql

本文链接：https://blog.csdn.net/alisa_ge/article/details/115984426

版权

本文介绍了如何使用Java Mybatis和阿里巴巴连接池替代Sqoop，高效地将Hive中的ORC格式数据批量写入MySQL。通过创建Maven工程并配置相关模块，包括设置依赖、定义数据源、实体类、服务类，以及编写Mapper XML文件，实现数据迁移过程。

摘要由CSDN通过智能技术生成

因为我们hive中的表数据保存的格式为orc,所以通过sqoop将hive数据导到mysql中，会保持原有的数据形态不变，然后mysql还需要解析orc文件，所以会导致数据导入到mysql会很慢。

所以我们使用mybatis阿里巴巴连接池将hive中的数据批量插入数据到mysql。

新建一个maven工程——mymybatistomysql。工程架构如下：

首先导入依赖包pom.xml文件

<properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    <maven.compiler.source>1.8</maven.compiler.source>
    <maven.compiler.target>1.8</maven.compiler.target>
  </properties>

  <dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>4.11</version>
      <scope>test</scope>
    </dependency>
    <!-- https://mvnrepository.com/artifact/mysql/mysql-connector-java -->
    <dependency>
      <groupId>mysql</groupId>
      <artifactId>mysql-connector-java</artifactId>
      <version>5.1.38</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.mybatis/mybatis -->
    <dependency>
      <groupId>org.mybatis</groupId>
      <artifactId>mybatis</artifactId>
      <version>3.4.6</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/com.alibaba/druid -->
    <dependency>
      <groupId>com.alibaba</groupId>
      <artifactId>druid</artifactId>
      <version>1.1.10</version>
    </dependency>

    <!-- https://mvnrepository.com/artifact/org.apache.hive/hive-jdbc -->
    <dependency>
      <groupId>org.apache.hive</groupId>
      <artifactId>hive-jdbc</artifactId>
      <version>1.1.0</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-common -->
    <dependency>
      <groupId>org.apache.hadoop</groupId>
      <artifactId>hadoop-common</artifactId>
      <version>2.6.0</version>
    </dependency>
  </dependencies>

其次，创建——DruidDataSourceFactory.java

package cn.alisa;

import com.alibaba.druid.pool.DruidDataSource;
import org.apache.ibatis.datasource.DataSourceFactory;

import javax.sql.DataSource;
import java.sql.SQLException;
import java.util.Properties;

//通过工厂方式获取数据源对象
public class DruidDataSourceFactory implements DataSourceFactory {