小程序猿
码龄13年
关注
提问 私信
  • 博客:30,780
    30,780
    总访问量
  • 9
    原创
  • 1,934,755
    排名
  • 4
    粉丝
  • 0
    铁粉

个人简介:参与过多个项目的开发,熟悉常见业务处理,团队意识强;责任心、执行力及抗压性强,能够积极的面对并解决工作中的问题;具备独立分析和解决问题的能力,有良好的职业道德和踏实的工作态度;乐观开朗,积极向上,喜欢骑行、爱学习;五年大数据工作经验,两年java开发经验,渴望从数据中提炼出价值。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河北省
  • 目前就职: 北京四维智联科技有限公司
  • 加入CSDN时间: 2012-05-02
博客简介:

小程序猿

查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得0次评论
  • 获得51次收藏
创作历程
  • 9篇
    2021年
成就勋章
TA的专栏
  • 大数据
    9篇
  • flink
    9篇
  • 机器学习算法
兴趣领域 设置
  • 大数据
    mysqlhbasehadoophiveredissparkflumeflinkkylinhdfsmapreducesqoop大数据etl
  • 后端
    scala
  • 云原生
    zookeeper
  • 微软技术
    sql
  • 搜索
    elasticsearch
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

flink生成Watermark之WatermarkStrategy

flink1.11版本后建议用WatermarkStrategy(Watermark生成策略)生成Watermark
原创
发布博客 2021.11.24 ·
9258 阅读 ·
7 点赞 ·
0 评论 ·
25 收藏

flink生成Watermark之assignTimestampsAndWatermarks

在DataStreamSource对象上调用assignTimestampsAndWatermarks方法,自定义Timestamp提取规则和Watermark生成规则。文章目录基于AssignerWithPeriodicWatermarks接口基于AssignerWithPeriodicWatermarks接口AssignerWithPeriodicWatermarks接口扩展自TimestampAssigner类,其中extractTimestamp方法定义抽取Timestamp,getCurre
原创
发布博客 2021.11.22 ·
10168 阅读 ·
0 点赞 ·
0 评论 ·
15 收藏

flink生成Watermark之SourceFunction

可以通过addSource方法来自定义SourceFunction,并可指定Timestamp和Watermark生成规则。
原创
发布博客 2021.11.22 ·
1362 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink时间戳和水位线简介

使用EventTime时间语义时,需指定时间戳(Timestamp)提取规则以及水位线(Watermark)生成策略,才能正确进行窗口计算。
原创
发布博客 2021.11.22 ·
952 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink语义(Streams、State、Time、API)与组件

文章目录StreamsStreams
原创
发布博客 2021.11.18 ·
692 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink主从架构、任务和算子链

图中客户端Client不是Flink运行时框架的一部分,而是用来准备和提交数据流作业的。由图可知,当flink代码编译后,一般会经过优化处理,当flink程序通过客户端提交任务Job到JobManager主节点后,JobManager会用任务调度器进行调度,并分配到从节点TaskManager上执行。Client、JobManager、TaskManager间通过Actor System实现通信,Actor是一种并发模型,其中基于Actor模型系统中的线程(或进程)通过消息传递的方式进行通信,而这些线.
原创
发布博客 2021.11.17 ·
603 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

毕业设计-婚庆管理web应用系统设计与实现代码

发布资源 2021.11.17 ·
zip

flink常见概念

Flink Application:一种java应用程序,主要通过main方法来提交一个或多个Flink Job.Flink Cluster:Flink集群是由至少一个Flink JobManager和一个或多个TaskManager进程组成的分布式系统。事件(Event):可以当做流处理或批处理应用程序当中的输入或输出,事件在flink中是一种特殊类型的记录(Record)。记录(Record):数据集或数据流的组成元素。Operator和Function接收record作为输入,并将record.
原创
发布博客 2021.11.17 ·
487 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink窗口分类

文章目录Dataflow模型数据流图流处理Dataflow模型Dataflow模型提供了一种统一流处理和批处理的系统框架。Dataflow模型对于无序流数据,提供了一套基于事件时间、水位线和延迟处理的机制,从而实现窗口聚合计算的能力,以实现流数据计算的正确性、高吞吐和延迟3者的平衡。数据流图数据流图有逻辑数据流图(节点表示算子)和物理数据流图(节点表示任务)。数据分配策略:转发分配策略:将流数据从一个任务节点直接分配到下一个任务节点。基于key分配策略:对数据分区,保证同一key的数据由同
原创
发布博客 2021.11.17 ·
763 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

flink环境搭建

Apache Flink是一个开源大数据框架和分布式处理引擎,用于在无边界(有定义流的开始,但没有定义流的结束)和有边界(有定义流的开始,也有定义流的结束)数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。1.flink依赖jdk和scala(安装省略)jdk环境变量配置:vim /etc/profileexport JAVA_HOME=/home/hadoop/jdk8export PATH=$JAVA_HOME/bin:$PATHexport
原创
发布博客 2021.11.16 ·
1766 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏