记一次Flink 写Mysql优化

需求:

      统计每5分钟内的活跃用户数,并写入mysql,mysql数据结构如下图所示。

    

时间 活跃用户数
10:00 2
10:05 4
10:10 3

废话不多说,直接上sql

select
	p_product,
	p_project,
	p_dt,
	SUBSTRING(FROM_UNIXTIME(UNIX_TIMESTAMP(p_ts)/ 300 * 300), 12, 5),
	count(distinct device_id)
from
	hive_catalog.t_kafka 
    /*+ OPTIONS   ('connector.properties.group.id'='my_group') */

group by
	p_product,
	p_project,
	p_dt,
	SUBSTRING(FROM_UNIXTIME(UNIX_TIMESTAMP(p_ts)/ 300 * 300), 12, 5)

 

其中p_ts 是事件时间。

 

写入mysql代码如下

.addSink(JdbcSink.sink("insert into active_num_5m(p_product,p_project,p_dt,event_time,num ) values(?,?,?,?,?) on duplicate key update num=values(num)",
                (JdbcStatementBuilder<Row>) (preparedStatement, row) -> {
                    preparedStatement.setString(1,getRowStr(row.getField(0)));
                    preparedStatement.setString(2,getRowStr(row.getField(1)));
                    preparedStatement.setString(3,getRowStr(row.getField(2)));
                    preparedStatement.setString(4,getRowStr(row.getField(3)));
                    preparedStatement.setInt(5, NumberUtils.createInteger(getRowStr(row.getField(4))));
                },
                new JdbcExecutionOptions.Builder().withBatchSize(NumberUtils.cre
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
以下是一个简单的使用Scala连接MySQL数据库,并使用Flink进行数据操作的程序: ```scala import java.sql.{Connection, DriverManager, PreparedStatement, ResultSet} import org.apache.flink.api.scala._ import org.apache.flink.configuration.Configuration import org.apache.flink.streaming.api.functions.sink.RichSinkFunction object MySQLSink { def main(args: Array[String]): Unit = { // 创建一个执行环境 val env = StreamExecutionEnvironment.getExecutionEnvironment // 读取数据源 val input = env.fromElements(("foo", 1), ("bar", 2), ("baz", 3)) // 将数据插入到MySQL数据库中 input.addSink(new MySQLSinkFunction) // 执行计算并输出结果 env.execute("MySQL Sink Example") } class MySQLSinkFunction extends RichSinkFunction[(String, Int)] { var connection: Connection = _ var preparedStatement: PreparedStatement = _ override def open(parameters: Configuration): Unit = { // 连接MySQL数据库 Class.forName("com.mysql.jdbc.Driver") connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/test", "root", "password") // 创建预编译语句 preparedStatement = connection.prepareStatement("INSERT INTO wordcount (word, count) VALUES (?, ?)") } override def invoke(value: (String, Int), context: SinkFunction.Context[_]): Unit = { // 将数据插入到MySQL数据库中 preparedStatement.setString(1, value._1) preparedStatement.setInt(2, value._2) preparedStatement.executeUpdate() } override def close(): Unit = { // 关闭连接 if (preparedStatement != null) preparedStatement.close() if (connection != null) connection.close() } } } ``` 运行以上代码,可以将数据源中的数据插入到MySQL数据库的`wordcount`表中。需要注意的是,上述代码中的数据库连接信息需要根据实际情况进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值