流操作读取MySQL数据


一、业务场景

开发过程中经常会使用MySQL存储数据,有时需要操作大批量数据,如迁移数据、导出数据。因此需要考虑使用高效、速度快且可靠的数据读取方式。

二、处理方式

1、常规查询:
	一次性读取全量数据到JVM内存中;
	分页读取,每次读取10000条;
2、流式查询:
	每次读取一条加载到JVM内存进行业务处理;

三、测试

Talk is cheap,show you the code.

1.常规查询

默认查询情况下,完整的检索结果集会存储在内存中。在大多数情况下,这是最有效的操作方式,更易于实现。
代码如下(示例):

package com.cxb.demotest;

import com.google.common.base.Stopwatch;
import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.util.concurrent.TimeUnit;
import javax.annotation.Resource;
import javax.sql.DataSource;
import lombok.extern.slf4j.Slf4j;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.test.context.junit4.SpringRunner;

@Slf4j
@SpringBootTest(classes = QuickStartDemoStart.class)
@RunWith(SpringRunner.class)
public class StreamQueryTest {

  @Resource
  private DataSource dataSource;

  @Test
  public void testQueryAll() throws Exception {
    String sql = "SELECT * from nucleic_acid_test_result_copy2  LIMIT 1000000";

    //从数据源拿到链接
    Connection connection = dataSource.getConnection();

    //根据链接创建statement进行sql提交
    PreparedStatement statement = connection.prepareStatement(sql);

    ResultSet resultSet = null;
    int count = 0;
    Stopwatch stopwatch = Stopwatch.createStarted();

    try {
      resultSet = statement.executeQuery();
      while (resultSet.next()) {
        String id = resultSet.getString("id");
        count++;
        System.out.println(id);
      }
    } catch (Exception e){
      log.error("普通读取报错:", e);
    }

    System.out.println("普通读取资源结束,获取了" + count + "行,用时" + stopwatch.elapsed(TimeUnit.SECONDS) + "s");
    //先开后关
    resultSet.close();
    statement.close();
    connection.close();

  }
}

查询结果:
在这里插入图片描述

2.流式查询

流式查询,其查询会独占连接(注意必须先读取或关闭结果集中的所有行,然后才能对连接发出任何其他查询,否则将引发异常)。代码如下:

@Test
public void testStreamQuery() throws Exception {
  String sql = "SELECT * from nucleic_acid_test_result_copy2  LIMIT 1000000 ";

  //从数据源拿到链接
  Connection connection = dataSource.getConnection();

  //根据链接创建statement进行sql提交,做一些statement配置
  PreparedStatement statement = connection.prepareStatement(sql, ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
  /**
   * createStreamingResultSet
   * We only stream result sets when they are forward-only, read-only, 
   * and the fetch size has been set to Integer.MIN_VALUE
   * 源码中:我们仅在结果集为 forward-only、read-only且提取大小已设置为 Integer.MIN_VALUE 时才对其进行流式处理
   * protected boolean createStreamingResultSet() {
   *         return ((this.query.getResultType() == Type.FORWARD_ONLY) 
   * 					&& (this.resultSetConcurrency == java.sql.ResultSet.CONCUR_READ_ONLY)
   *                 	&& (this.query.getResultFetchSize() == Integer.MIN_VALUE));
   * }
   */
  statement.setFetchSize(Integer.MIN_VALUE);
  //====================statement执行sql======================
  Stopwatch stopwatch = Stopwatch.createStarted();
  ResultSet resultSet = statement.executeQuery();//期间不会阻塞 直接返回结果行,过多的缓存在驱动内存中
  //================================================
  int count = 0;
  while (resultSet.next()) {
    String id = resultSet.getString("id");
    count++;
    System.out.println(id);
  }

  System.out.println("流式读取资源结束,获取了" + count + "行,用时" + stopwatch.elapsed(TimeUnit.SECONDS) + "s");
  //先开后关
  resultSet.close();
  statement.close();
  connection.close();

}

查询结果:

四、测试结果

从测试结果对比,从MySQL查询100W条数据,使用流式读取速度快了将近一倍。

五、总结

流式读取的优点:
	可以解决内存资源紧张的情况的下,导致的OOM。
	对数据可以平滑的处理,匹配数据资源获取非阻塞。
	内存资源的使用上,避免了内存消耗突然提高的风险。
	避免了在需要大数据读取场景下的,手动分页去多次请求读取,一次查询,流式读取。
应用场景
	我们可以做一些大量的数据读取后,做数据分析。以及我们需要做大量的数据下载到本地的时候,都可以以流式读取后输出到本地。

参考资料

MySQL中的流式查询及游标查询方式(总结分享)
MySQL如何流式读取千万级大数据

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: Flink可以使用JDBC连接MySQL数据库,并读取数据。以下是使用Flink读取MySQL数据库中数据的代码示例:DataSource<Row> data = env.createInput(JdbcInputFormat.buildJdbcInputFormat() ### 回答2: 使用Apache Flink读取MySQL数据的代码如下: ```java import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.api.java.tuple.Tuple3; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.api.functions.source.SourceFunction; import org.apache.flink.streaming.api.functions.source.SourceFunction.SourceContext; import java.sql.*; public class ReadMySQLData { public static void main(String[] args) throws Exception { // 创建执行环境 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); // 添加MySQL数据源 env.addSource(new MySQLSource()) .print(); // 执行任务 env.execute("Read MySQL Data"); } } class MySQLSource implements SourceFunction<Tuple3<Integer, String, Double>> { private volatile boolean isRunning = true; @Override public void run(SourceContext<Tuple3<Integer, String, Double>> ctx) throws Exception { // 加载MySQL驱动 Class.forName("com.mysql.jdbc.Driver"); // 创建数据库连接 String url = "jdbc:mysql://localhost:3306/flink"; String username = "username"; String password = "password"; Connection conn = DriverManager.getConnection(url, username, password); // 创建Statement对象 Statement stmt = conn.createStatement(); // 执行查询 String query = "SELECT id, name, salary FROM employees"; ResultSet rs = stmt.executeQuery(query); // 处理结果集并发送数据 while (rs.next() && isRunning) { int id = rs.getInt("id"); String name = rs.getString("name"); double salary = rs.getDouble("salary"); ctx.collect(new Tuple3<>(id, name, salary)); } // 关闭资源 rs.close(); stmt.close(); conn.close(); } @Override public void cancel() { isRunning = false; } } ``` 以上代码创建了一个Apache Flink作业,通过添加MySQL数据源来读取MySQL数据库中的数据。首先,我们需要加载MySQL驱动并创建数据库连接。然后,我们创建一个Statement对象并执行查询,将结果集中的数据收集到SourceContext中。最后,我们关闭资源,并在取消操作时停止任务的执行。 ### 回答3: Flink是一个开源的流式数据处理框架,可以处理各种类型的数据。下面是一个示例代码,用于在Flink中读取MySQL数据: 首先,你需要在pom.xml中添加Flink连接MySQL的依赖项: ```xml <dependencies> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-jdbc_2.12</artifactId> <version>1.13.2</version> </dependency> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>8.0.23</version> </dependency> </dependencies> ``` 然后,你需要创建一个Flink的执行环境,并设置连接到MySQL的信息: ```java import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.api.java.utils.ParameterTool; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.api.functions.source.SourceFunction; import org.apache.flink.streaming.api.functions.source.SourceFunction.SourceContext; public class ReadFromMySQL { public static void main(String[] args) throws Exception { // 创建执行环境 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置连接到MySQL的信息 ParameterTool parameterTool = ParameterTool.fromArgs(args); String mysqlUrl = parameterTool.get("mysqlUrl"); String mysqlUsername = parameterTool.get("mysqlUsername"); String mysqlPassword = parameterTool.get("mysqlPassword"); // 创建MySQL数据源 SourceFunction<Tuple2<Integer, String>> sourceFunction = new MySQLSourceFunction(mysqlUrl, mysqlUsername, mysqlPassword); // 从MySQL读取数据 env.addSource(sourceFunction) .print(); // 执行任务 env.execute("Read from MySQL"); } public static class MySQLSourceFunction implements SourceFunction<Tuple2<Integer, String>> { private String mysqlUrl; private String mysqlUsername; private String mysqlPassword; private volatile boolean isRunning = true; public MySQLSourceFunction(String mysqlUrl, String mysqlUsername, String mysqlPassword) { this.mysqlUrl = mysqlUrl; this.mysqlUsername = mysqlUsername; this.mysqlPassword = mysqlPassword; } @Override public void run(SourceContext<Tuple2<Integer, String>> ctx) throws Exception { // 连接到MySQL数据库,执行查询语句,读取数据并发送到下游 // 这里需要使用你自己的MySQL连接逻辑 // 示例代码中使用一个while循环读取数据并发送 while (isRunning) { // 读取数据 // ... // 发送数据到下游 // ctx.collect(new Tuple2<>(id, name)); // 控制数据读取速率 Thread.sleep(1000); } } @Override public void cancel() { isRunning = false; } } } ``` 在这个示例代码中,我们使用了Flink的`StreamExecutionEnvironment`来创建执行环境,并通过`ParameterTool`来获取MySQL连接信息。然后,我们创建了一个自定义的`SourceFunction`,在这个函数中连接到MySQL数据库,执行查询语句,读取数据并发送到下游。在示例代码中,为了简化,只是用一段注释来代替实际的MySQL连接和数据读取逻辑。你需要根据自己的情况实现这部分逻辑。 最后,通过`env.addSource(sourceFunction)`将MySQL数据源添加到Flink的执行环境中,并通过`env.execute()`来执行任务。 希望以上回答对你有帮助!
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值