flink 学习(三)mysql 作为数据源

一、jdbc连接

1、引入依赖

<!-- https://mvnrepository.com/artifact/org.apache.flink/flink-connector-jdbc -->
<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-connector-jdbc_2.12</artifactId>
    <version>1.14.4</version>
    <scope>provided</scope>
</dependency>

2、实体类

public class UserInfo {
   private Integer userId;
   private String userName;
   private String userRealName;
   private String userPwd;
   private String userTel;
   private String userEmail;
   private Integer userStatus;
   private Date userCreateTime;
   private Date userUpdateTime;
}

二、自定义 SourceFunction

public class MysqlRichParallelSource extends RichParallelSourceFunction<User> {


    private boolean close = false;

    @Override
    public void run(SourceContext<User> out) throws Exception {
        String url = "jdbc:mysql://192.168.100.88:3306/newframe?useUnicode=true&characterEncoding=UTF-8&serverTimezone=Asia/Shanghai&useSSL=false&allowMultiQueries=true&rewriteBatchedStatements=true";
        String sql = "select * from user_info";
        Connection conn = null;
        PreparedStatement ps = null;
        ResultSet rs = null;
        try {
            conn = DriverManager.getConnection(url, "root", "root");
            ps = conn.prepareStatement(sql);
        } catch (SQLException e) {
            e.printStackTrace();
        }

        while (!close) {
            rs = ps.executeQuery();
            while (rs.next()) {
                Integer userId = rs.getInt("user_id");
                String userName = rs.getString("user_name");
                String userRealName = rs.getString("user_real_name");
                User user = new User()
                        .setUserId(userId)
                        .setUserName(userName)
                        .setUserRealName(userRealName);
                //收集数据
                out.collect(user);
            }
            Thread.sleep(5000);
            cancel();
        }
        close(conn, ps, rs);
    }

    @Override
    public void cancel() {
        close = true;
    }

    public void close(Connection conn, PreparedStatement ps, ResultSet rs) throws Exception {
        if (conn != null) {
            conn.close();
        }
        if (ps != null) {
            ps.close();
        }
        if (rs != null) {
            rs.close();
        }
    }
}

三、测试

	@Test
    public void fromMysqlTest() throws Exception {
        // flink 流执行环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //设置模式 STREAMING
        env.setRuntimeMode(RuntimeExecutionMode.STREAMING);
                //添加mysql数据源
        DataStreamSource<User> source = env.addSource(new MysqlRichParallelSource());
        //打印结果
        source.print();
        //开始执行
        env.execute("flink streaming from mysql");
    }

结果:多线程同时从mysql获取数据,启动了8个线程,每个数据获取了8次

2> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
8> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
6> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
3> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
5> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
4> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
1> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
7> User(userId=20, userName=wangwu2, userRealName=王五2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
4> User(userId=22, userName=user1, userRealName=用户1, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
5> User(userId=22, userName=user1, userRealName=用户1, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
3> User(userId=22, userName=user1, userRealName=用户1, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
6> User(userId=22, userName=user1, userRealName=用户1, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)
6> User(userId=23, userName=user2, userRealName=用户2, userPwd=null, userTel=null, userEmail=null, userStatus=null, userCreateTime=null, userUpdateTime=null)

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
为了使用MySQL数据源作为FlinkML的KNN模型处理,需要进行以下步骤: 1. 安装MySQL数据库,并创建一个表格,用于存储训练数据。表格应该包含所有特征和目标变量。 2. 将数据加载到MySQL表格中。 3. 在Flink程序中,使用MySQL数据源连接到表格。可以使用Flink的JDBC连接器或者自定义的MySQL连接器。 4. 使用FlinkML的KNN算法训练模型。KNN算法需要指定K值和距离度量方法。 5. 使用训练好的模型对测试数据进行预测,并计算预测结果的准确性。 6. 可以使用Flink的流处理功能将预测结果发送到其他系统或者存储到另一个数据源中。 下面是一个使用Flink的JDBC连接连接MySQL数据源并训练KNN模型的示例代码: ``` // 导入必要的包 import org.apache.flink.api.java.ExecutionEnvironment; import org.apache.flink.api.java.io.jdbc.JDBCInputFormat; import org.apache.flink.api.java.io.jdbc.JDBCOutputFormat; import org.apache.flink.api.java.tuple.Tuple2; import org.apache.flink.api.java.tuple.Tuple3; import org.apache.flink.ml.classification.KNN; import org.apache.flink.ml.math.DenseVector; import org.apache.flink.ml.math.Vector; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.types.Row; // 创建Flink执行环境 ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment(); // 创建MySQL连接器 String username = "root"; String password = "password"; String dbURL = "jdbc:mysql://localhost:3306/test"; JDBCInputFormat inputFormat = JDBCInputFormat.buildJDBCInputFormat() .setDrivername("com.mysql.jdbc.Driver") .setDBUrl(dbURL) .setUsername(username) .setPassword(password) .setQuery("SELECT feature1, feature2, feature3, target FROM training_data") .finish(); // 读取MySQL中的数据 DataSet<Row> data = env.createInput(inputFormat); // 转换数据格式 DataSet<Tuple3<Vector, Vector, Double>> trainingData = data.map(row -> { double[] features = new double[3]; features[0] = row.getField(0); features[1] = row.getField(1); features[2] = row.getField(2); double target = row.getField(3); DenseVector featureVector = new DenseVector(features); DenseVector targetVector = new DenseVector(new double[]{target}); return new Tuple3<>(featureVector, targetVector, target); }); // 训练KNN模型 int k = 3; KNN knn = new KNN() .setK(k) .setDistanceMetric(new EuclideanDistance()) .setBlocks(10); knn.fit(trainingData); // 使用模型进行预测 DenseVector testFeatureVector = new DenseVector(new double[]{1.2, 2.3, 3.4}); Vector predictedTarget = knn.predict(testFeatureVector); // 输出预测结果 System.out.println("Predicted target: " + predictedTarget); ``` 注意,此示例代码仅用于说明如何使用MySQL数据源作为FlinkML的KNN模型处理。实际使用时,需要根据具体需求进行适当修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_lrs

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值