自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 flinksql的双流join,窗口topn中遇到的问题。

针对于流数据进行求topn或者去重,如果不指定窗口,用传统的批处理方式则无法实现topn或者去重的目的,会发现每条流数据都是top1。只有通过窗口的方式将数据进行收集才能针对于窗口内的数据进行去重或者求topn。则会出现:当A流数据过来时,会和B流所有历史数据以及当前数据进行join。flinksql进行双流join时,如果不指定时间范围,如下图所示。如果指定时间范围,则只会和时间范围内的数据进行join。

2024-09-07 17:51:27 294 1

原创 flink自定义udf函数和udtf函数,注册,引用以及对应的依赖

再引用: gethttps_function(`a1`.`graphic_details`)// 正则表达式匹配 src 属性中的 URL。-- Table的公共依赖 -->

2024-07-31 19:08:39 305

原创 flinksql通过mysqlcdc将mysql数据写入kafka的null值处理

以下图所示,已经去掉null值了.

2024-07-31 18:58:59 256

原创 flinksql实时统计mysql数据,写入mysql中以及对应的maven依赖

/3.查询数据并转换为流输出。

2024-07-16 10:57:00 661 1

原创 doris或者startRocks的建表规范

表示以今天为时间基准,创建且保留多少天的历史分区数,为负数。表示以今天为时间基准,创建且保留多少天的未来分区数,为正数。因此上图的总分区就是90+60=150个分区。

2024-02-26 17:14:19 499

原创 flinksql去消费kafka的数据,当不使用窗口机制,有数据输出,当使用窗口机制,就没有数据输出,怎么办?

如上图,当不使用窗口时,flinksql就可以输出数据,控制台可以看出。如上图,当使用窗口机制后,flinksql一直没有数据输出,将。update_time设置为timestamp(3)

2023-11-08 14:05:05 249 3

原创 当binlog日志数据无法拉取时,怎么办

其中binlog_row_image包含:FULL,MINIMAL和noblob三种模式,FULL模式为binlog日志记录下所有的前镜像和后镜像,MINIMAL模式为binlog日志的前镜像,其只记录唯一识别列(例如唯一索引列、主键列),后镜像只记录修改列,noblob为binlog记录所有的列,就像full格式一样。binlog有statement , row 和mixed这三种格式,其中binlog_format=STATEMENT,为记录原始的语句,但是会造成主从数据不一致的问题。

2023-11-07 14:49:15 67

原创 当startRocks出现/data/starrocks/be/storage/data/目录下的.dat文件消失时,怎么办?

此时将对应的表删除后重建,观察是否可以插入,如果还是不行,就重新启动startRocks集群。

2023-11-07 13:41:45 152

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除