记一次Flink 写Mysql优化

本文记录了一次使用Flink统计每5分钟活跃用户数并写入MySQL的优化过程。由于离线任务对MySQL的压力,导致实时任务出现超时问题。通过调整Flink SQL查询方式,避免了数据不准确和反压问题,显著降低了MySQL的写入压力,优化后运行稳定,未再出现连接超时故障。
摘要由CSDN通过智能技术生成

需求:

      统计每5分钟内的活跃用户数,并写入mysql,mysql数据结构如下图所示。

    

时间 活跃用户数
10:00 2
10:05 4
10:10 3

废话不多说,直接上sql

select
	p_product,
	p_project,
	p_dt,
	SUBSTRING(FROM_UNIXTIME(UNIX_TIMESTAMP(p_ts)/ 300 * 300), 12, 5),
	count(distinct device_id)
from
	hive_catalog.t_kafka 
    /*+ OPTIONS   ('connector.properties.group.id'='my_group') */

group by
	p_product,
	p_project,
	p_dt,
	SUBSTRING(FROM_UNIXTIME(UNIX_TIMESTAMP(p_ts)/ 300 * 300), 12, 5)

 

其中p_ts 是事件时间。

 

写入mysql代码如下

.addSink(JdbcSink.sink("insert into active_num_5m(p_product,p_project,p_dt,event_time,num ) values(?,?,?,?,?) on duplicate key update num=values(num)",
                (JdbcStatementBuilder<Row>) (preparedStatement, row) -> {
                    preparedStatement.setString(1,getRowStr(row.getField(0)));
                    preparedStatement.setString(2,getRowStr(row.getField(1)));
                    preparedStatement.setString(3,getRowStr(row.getField(2)));
                    preparedStatement.setString(4,getRowStr(row.getField(3)));
                    preparedStatement.setInt(5, NumberUtils.createInteger(getRowStr(
以下是一个简单的使用Scala连接MySQL数据库,并使用Flink进行数据操作的程序: ```scala import java.sql.{Connection, DriverManager, PreparedStatement, ResultSet} import org.apache.flink.api.scala._ import org.apache.flink.configuration.Configuration import org.apache.flink.streaming.api.functions.sink.RichSinkFunction object MySQLSink { def main(args: Array[String]): Unit = { // 创建一个执行环境 val env = StreamExecutionEnvironment.getExecutionEnvironment // 读取数据源 val input = env.fromElements(("foo", 1), ("bar", 2), ("baz", 3)) // 将数据插入到MySQL数据库中 input.addSink(new MySQLSinkFunction) // 执行计算并输出结果 env.execute("MySQL Sink Example") } class MySQLSinkFunction extends RichSinkFunction[(String, Int)] { var connection: Connection = _ var preparedStatement: PreparedStatement = _ override def open(parameters: Configuration): Unit = { // 连接MySQL数据库 Class.forName("com.mysql.jdbc.Driver") connection = DriverManager.getConnection("jdbc:mysql://localhost:3306/test", "root", "password") // 创建预编译语句 preparedStatement = connection.prepareStatement("INSERT INTO wordcount (word, count) VALUES (?, ?)") } override def invoke(value: (String, Int), context: SinkFunction.Context[_]): Unit = { // 将数据插入到MySQL数据库中 preparedStatement.setString(1, value._1) preparedStatement.setInt(2, value._2) preparedStatement.executeUpdate() } override def close(): Unit = { // 关闭连接 if (preparedStatement != null) preparedStatement.close() if (connection != null) connection.close() } } } ``` 运行以上代码,可以将数据源中的数据插入到MySQL数据库的`wordcount`表中。需要注意的是,上述代码中的数据库连接信息需要根据实际情况进行修改。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值