flink
文章平均质量分 61
雷禄辉
交流治愈愚拙,分享使人进步。
展开
-
Flink基础学习(Scala):时间语义与水位线(Watermark)
文章目录一、时间语义1.1 几个时间概念1.2 如何设置时间语义二、前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结一、时间语义1.1 几个时间概念Event Time : 事件时间,记录的是设备生产(或者存储)事件时间Ingestion Time : 摄取时间,Flink读取事件的时间Processing Time : 处理时间,执行操作算子的本地系统时间,与机器有关在生成环境中我们往往更关心事件时间1.2 如何设置时间语义二、提示:这里可以添加系列文章的所有文章的原创 2021-04-05 09:38:41 · 862 阅读 · 0 评论 -
Flink基础学习(Scala):窗口函数window
文章目录一、前言二、窗口类型2.1 时间窗口(Time Window)2.1.1 滚动时间窗口2.1.2 滑动时间窗口2.1.3 会话窗口2.2 计数窗口(Count WIndow)2.2.1 滚动计数窗口2.2.2 滑动计数窗口三、总结一、前言窗口就是将无限流切割成有限流的一种方式,它会将流数据分发到有限大小的桶中进行分析二、窗口类型2.1 时间窗口(Time Window)2.1.1 滚动时间窗口所谓滚动窗口就是将数据依据固定的窗口的长度对数据进行切分(注意切分数据段是前闭后开),所以窗口长原创 2021-04-04 23:53:51 · 1285 阅读 · 0 评论 -
Flink基础学习(Scala):数据输出Sink
文章目录一、前言二、数据输出2.1 输出到文件2.2 输出到Kafka2.3 输出到Redis2.4 输出到ElasticSearch2.5 输出到MySQL三、总结系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结一、前言前面我们已经学习了Flink的读取及转换,这篇文章将讲讲如何将转换后的数据输出,也就是数据落地,落地后给第三方进行使用二、数据输出数据落地多种方式,我们将从以下几个方面来说明2.1 输出到文件import org.apache.flink.api.原创 2021-04-02 23:07:00 · 1522 阅读 · 0 评论 -
Flink基础学习(Scala):数据转换算子Transform
文章目录一、前言二、算子2.1 简单算子2.2 聚合算子2.3 多流转换算子系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结一、前言前言二、算子2.1 简单算子常见的简单算子有map、flatmap、filter等等,下面通过代码来实现一下import org.apache.flink.streaming.api.scala._object StreamTransform { def main(args: Array[String]): Unit = {原创 2021-03-22 21:53:52 · 1043 阅读 · 1 评论 -
Flink基础学习(Scala):获取数据来源Source
文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例原创 2021-03-18 22:46:45 · 697 阅读 · 0 评论 -
Flink基础学习(Scala):设置并行度
文章目录一、前言二、如何设置并行度三、并行度的优先级四、总结一、前言说到并行度,应该不陌生,其实很多程序的优化到最后都是在优化这个,接下来说说如何设置并行度二、如何设置并行度要知道如何设置并行度,就先要知道哪些地方可以设置并行度,只要知道了哪些地方可以设置并行度,也就知道如何设置了,有点绕,接下来我列举出来集群配置文件flink-conf.yaml配置文件中有parallelism.default这么个参数,就是配置并行度,默认是1,这个是针对所有程序,没有给并行度是的默认并行度例如: p原创 2021-03-13 21:37:58 · 1276 阅读 · 0 评论 -
Flink基础学习(Scala): 提交作业到集群上
文章目录一、前言二、打包三、提交作业的方式前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结一级目录二级目录三级目录一、前言前面已经编写了Flink第一个代码程序,并且也运行了,但是你会发现只是在IDEA上运行的,这种只适合开发,真正工作中我们更多的是要将写好的程序部署到集群上去跑,所以接下来说说如何将作业提交到集群上。二、打包三、提交作业的方式提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的原创 2021-03-13 16:27:51 · 586 阅读 · 2 评论 -
Flink基础学习(Scala): 简单入门World Count
文章目录一、前提准备二、使用步骤2.1 添加flink依赖2.2系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结一、前提准备这里将以IDEA作为开发软件,首先我们得创建一个maven项目(如何创建maven请自行百度)二、使用步骤2.1 添加flink依赖<dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</原创 2021-03-08 23:22:55 · 983 阅读 · 1 评论 -
Flink的安装部署
文章目录一、前提条件二、安装步骤2.1 下载安装包2.2 解压安装包2.3 启动flink2.4 提交任务测试2.5 停止flink三、安装包目录结构介绍四、总结一、前提条件本文将以本地安装来说明,也就是standalone模式,以flink-1.12.0为例,java version: >= 8.0scala version: >= 2.11查看java版本命令: java -version二、安装步骤2.1 下载安装包下载flink,这边选择1.12.0版本, scala版本原创 2021-03-07 11:14:49 · 618 阅读 · 0 评论