java多线程数据导入构想

公司最近在一些项目中需要与其它公司进行数据对接,以及公司自身的系统升级,需要把上T的数据移植到新系统中。

考虑过用 DTS,与IBM的data工具,但是对于这种业务逻辑过多的处理情况下,并不好实现。

所以我采用java来做。

不过java面临几大问题:

1,JDBC性能有限, 正常情况下(数据库服务器都有业务请求),jdbc批处理一秒最多200条数据, 在晚上没有业务请求时,可达到 3-500,是已经是最快了。

2,随便一个表的数据都在亿行,除去中间转换,如果照这个中间速度300行,导1亿行数据需要。1亿/300 秒,

大概要,100个小时,5天才能搞完一个表。

3,根据以前对多线程的了解,打算使用以前的框架来做, 如果能开上 100个线程,这样1亿行数据就可以,1小时搞定。如果能开 500线程就10分钟可以搞定一个表。呵呵,理想中是这样...

 

能想到就能做到,在后面的开发过程中,普通PC开发机器上1G内存,

程序正常在JVM分配 512M内存下,可开启200线程。

20几分钟,就完成1亿数据的转移。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
你可以使用Java多线程来实现数据导入MySQL的功能。下面是一个简单的示例代码: ```java import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.SQLException; import java.util.ArrayList; import java.util.List; public class DataImporter { private static final String DB_URL = "jdbc:mysql://localhost:3306/mydatabase"; private static final String DB_USER = "username"; private static final String DB_PASSWORD = "password"; public static void main(String[] args) { List<String> data = getDataToImport(); // 获取待导入数据 int numThreads = 5; // 设置线程数 int batchSize = data.size() / numThreads; // 每个线程处理的数据量 List<Thread> threads = new ArrayList<>(); for (int i = 0; i < numThreads; i++) { int start = i * batchSize; int end = (i == numThreads - 1) ? data.size() : (i + 1) * batchSize; List<String> subData = data.subList(start, end); Thread thread = new Thread(() -> { try { importData(subData); // 导入数据到MySQL } catch (SQLException e) { e.printStackTrace(); } }); thread.start(); threads.add(thread); } // 等待所有线程完成 for (Thread thread : threads) { try { thread.join(); } catch (InterruptedException e) { e.printStackTrace(); } } System.out.println("数据导入完成!"); } private static List<String> getDataToImport() { // 返回待导入数据 // TODO: 实现该方法,获取数据源 return null; } private static void importData(List<String> data) throws SQLException { try (Connection conn = DriverManager.getConnection(DB_URL, DB_USER, DB_PASSWORD)) { String sql = "INSERT INTO mytable (column1, column2) VALUES (?, ?)"; PreparedStatement pstmt = conn.prepareStatement(sql); for (String item : data) { // 设置参数 // TODO: 根据数据格式和表结构,设置参数的值 pstmt.setString(1, item); pstmt.setString(2, item); pstmt.addBatch(); // 添加到批处理 } pstmt.executeBatch(); // 执行批处理 } } } ``` 请根据你的实际情况修改代码中的数据库连接信息、表名、列名以及获取数据源的方式。这段代码将会使用多个线程来并行地导入数据到MySQL数据库。每个线程处理一部分数据,最后等待所有线程完成后输出导入完成的消息。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值