自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 头歌:计算排行榜并实时输出

要求每 30 秒计算之前 2 分钟的时间窗口数据, 对其中的浏览商品行为(即行为类型为 pv)进行浏览次数的计算,并输出浏览次数排名前 3 的商品结果。对于实时数据,我们之前进行了基本的计算,但是我们还要用 Flink 的方式来实时获得数据和实时输出数据,以及用 Flink 的方式来计算实时数据。为了完成本关任务,你需要掌握:如何计算排行榜并实时输出。根据提示,在右侧编辑器补充代码,计算排行榜并实时输出,

2024-06-25 15:37:38 149

原创 头歌:设置时间窗口并进行计算

滚动窗口会将数据按固定时间段分为各个时间窗口,比如固定时间段为10分钟,那一小时的数据就会被分为6个时间窗口,每个时间窗口10分钟。要求对其中的数据按每 20 分钟为一个时间窗口,对其中的浏览商品行为(即行为类型为 pv)进行时间戳最大值的计算,并输出结果,滑动窗口会每隔一段时间,计算之前某个时间段的数据,比如每隔3分钟,计算之前一个小时的数据。Flink 对数据的时间计算一般要设置时间窗口,然后对时间窗口中的数据进行计算。根据提示,在右侧编辑器补充代码,设置时间窗口并进行计算,输出结果,

2024-06-25 15:32:08 246

原创 头歌:对数据进行过滤和分流

Flink 操作流数据,一般都要进行过滤和分流,过滤使用 filter 算子,分流使用 keyBy 算子, filter 算子加上条件就可以进行过滤,如:filter (行为字段 == "cart"),就可以过滤出放入购物车的记录, keyBy 算子可以对数据进行分流,一般是对 id 等主键进行分流,如 keyBy(商品 Id),就是按商品 Id 进行分流,相同商品 Id 的放在一起,分流的数据会在之后按时间窗口计算时使用到。为了完成本关任务,你需要掌握:如何用 Flink 对数据进行过滤和分流。

2024-06-25 15:18:48 207

原创 头歌 :用 Flink 获得数据并输出

为了完成本关任务,你需要掌握:如何用 Flink 获得数据并输出。本关任务:编写一个能用 Flink 获得数据并输出的小程序。

2024-06-25 15:05:33 344

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除