自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据技术博客

主要关注大数据周边技术 hadoop spark storm flink等...

  • 博客(20)
  • 资源 (16)
  • 收藏
  • 关注

原创 flink中文文档-目录v1.4

Flink入门及实战-上:http://edu.51cto.com/sd/07245Flink入门及实战-下:http://edu.51cto.com/sd/5845eflink1.4中文文档第一次翻译文档,如果有错误之处,还望谅解,有问题可以私信或者在对应的翻译内容下面进行回复,多谢!相关文档快速链接目录概念介绍(Concepts)flink原理介绍-数据流编...

2018-03-09 00:07:01 3460

原创 Flink 状态与容错 ( state 和 Fault Tolerance)

Flink 状态与容错状态性的函数和操作通过处理单个(元素/事件)存储数据,使任何类型的state构建更复杂的操作。例如:当应用程序针对特定事件模式进行搜索的时候,state将会存储到目前为止的一些列事件。当每 分钟/小时/天 聚合事件的时候,state会持有所有等待聚合的数据。当在一连串的数据流上训练机器学习模型时,state持有当前版本的模型参数。当历史数据需要管理的时候,state允许高效的...

2018-03-31 20:40:46 1800

原创 Flink Distributed Cache 分布式缓存

Flink提供了一个分布式缓存,类似于hadoop,可以使用户在并行函数中很方便的读取本地文件。此功能可用于共享文件,包含静态的外部数据,例如字典或者machine-learned回归模型。此缓存的工作机制如下:程序注册一个文件或者目录(本地或者远程文件系统,例如hdfs或者s3),通过ExecutionEnvironment注册缓存文件并为它起一个名称。当程序执行,Flink自动将文件或者目...

2018-03-31 00:06:22 4824 6

原创 Flink accumulator Counter 累加器 和 计数器

Accumulators(累加器)是非常简单的,通过一个add操作累加最终的结果,在job执行后可以获取最终结果最简单的累加器是counter(计数器):你可以通过Accumulator.add(V value)这个方法进行递增。在任务的最后,flink会吧所有的结果进行合并,然后把最终结果发送到client端。累加器在调试或者你想更快了解你的数据的时候是非常有用的。Flink现在有一下内置...

2018-03-30 23:32:37 8250

原创 Flink Broadcast 广播变量

Broadcast 广播变量:一句话解释,可以理解为是一个公共的共享变量,我们可以把一个dataset 数据集广播出去,然后不同的任务在节点上都能够获取到,这个数据在每个节点上只会存在一份。如果不使用broadcast,则在每个节点中的每个任务中都需要拷贝一份dataset数据集,比较浪费内存(也就是一个节点中可能会存在多份dataset数据)。Broadcast variables允许...

2018-03-30 09:18:17 10641 1

原创 Flink HA安装配置实战

Flink HA配置文档详细HA原因及原理介绍说明请查看此博客链接,https://blog.csdn.net/xu470438000/article/details/79633824本文档只涉及HA具体安装步骤Flink Standalone集群HA配置1.HA集群环境规划使用三台节点实现两主两从集群(由于笔记本性能限制,不能开启太多虚拟机,其实使用三台和四台机...

2018-03-25 08:57:55 3339 1

原创 Flink HA配置

JobManager 高可用(HA)jobManager协调每个flink任务部署。它负责调度和资源管理。默认情况下,每个flink集群只有一个JobManager,这将导致一个单点故障(SPOF):如果JobManager挂了,则不能提交新的任务,并且运行中的程序也会失败。使用JobManager HA,集群可以从JobManager故障中恢复,从而避免SPOF 。 用户在stand...

2018-03-22 09:07:55 6529

原创 flink yarn-session的两种使用方式

flink on yarn模式中,flink yarn-session的两种使用方式分析第一种:在yarn中初始化一个flink集群,开辟指定的资源,以后提交任务都向这里提交。这个flink集群会常驻在yarn集群中,除非手工停止。第二种(推荐):每次提交都会创建一个新的flink集群,任务之间互相独立,互不影响,方便管理。任务执行完成之后创建的集群也会消失。获取...

2018-03-20 22:39:16 17743 5

原创 flink on yarn 集群模式启动报错及解决方案汇总

注意:想要使用flink on yarn 模式,需要确保hadoop集群启动成功,并且需要在yarn的某一个节点上面执行flink on yarn的脚本没有启动hadoop集群,执行flink的bin/yarn-session.sh脚本会报下面错误 脚本会一直卡在这里,一直输出重试日志,连不上resoucemanager,说明hadoop集群每启动 2018-03-17 12:30:...

2018-03-17 21:58:07 19607

原创 flink部署操作-flink on yarn集群安装部署

flink集群安装部署yarn集群模式Flink入门及实战-上:http://edu.51cto.com/sd/07245Flink入门及实战-下:http://edu.51cto.com/sd/5845e快速开始在yarn上启动一个一直运行的flink集群 在yarn上运行一个flink jobflink yarn session启动flink ses...

2018-03-16 09:32:05 50016 4

原创 flink部署操作-flink standalone集群安装部署

flink集群安装部署standalone集群模式必须依赖必须的软件 JAVA_HOME配置flink安装配置flink 启动flink 添加Jobmanager/taskmanager 实例到集群个人真实环境实践安装步骤必须依赖必须的软件flink运行在所有类unix环境中,例如:linux、mac、或者cygwin,并且集群由一个master节...

2018-03-16 09:28:29 15852 1

原创 flink项目开发-flink的scala shell命令行交互模式开发

flink的 scala shell命令行交互模式开发flink带有一个集成的scala shell命令行。它可以以本地方式启动来模拟集群集群。执行下面的命令就可以通过shell命令行和flink集群交互(这种方式方便于代码调试):bin/start-scala-shell.sh local如果想在集群上面运行scala shell,请查看本节后面的内容。flink ...

2018-03-12 09:37:36 4386 2

原创 flink基本原理及应用场景分析

Apache Flink 是一个开源的分布式,高性能,高可用,准确的流处理框架。支持实时流处理和批处理flink特性支持批处理和数据流程序处理 优雅流畅的支持java和scala api 同时支持高吞吐量和低延迟 支持事件处理和无序处理通过SataStream API,基于DataFlow数据流模型 在不同的时间语义(时间时间,处理时间)下支持灵活的窗口(时间,技术,会话...

2018-03-11 11:14:26 19755

原创 flink项目开发-配置jar依赖,连接器,类库

Flink 免费视频直播课程地址:https://ke.qq.com/course/283798配置依赖,连接器,类库每个Flink应用程序依赖于一组Flink库。在最低限度,应用程序只依赖Flink api。许多应用程序依赖特定的连接器库(如kafka,cassandra,等等)。Flink运行应用程序时(在分布式部署,或在IDE中测试),Flink运行时库必须是可用的。Fli...

2018-03-11 00:06:12 9601 1

原创 flink实例开发-batch批处理实例

batch批处理实例下面的示例程序将展示flink的不同应用程序从简单的单词计数到图计算。示例代码演示使用Flink的DataSet API。以下的全部源代码和更多的例子可以在flink源码仓库的flink-examples-batch或者flink-examples-streaming模块中看到。运行一个示例 Word Count 单词计数 Page Rank 网页排名 ...

2018-03-10 22:56:00 13906

原创 flink实例开发-详细使用指南

Flink入门及实战-上:http://edu.51cto.com/sd/07245Flink入门及实战-下:http://edu.51cto.com/sd/5845eflink实例开发-详细使用指南配置一个maven项目 编写一个flink程序 编程实战:编写一个向kafka写数据的程序在集群运行 flink整合kafka在本指南中,我们将从头开始,从flink项...

2018-03-10 17:50:00 50649 3

原创 flink项目开发-scala代码模板开发flink指南

scala代码开发flink指南构建工具 sbt【建议参考使用下面的maven,sbt模块暂时不做翻译】 maven必须的依赖 创建项目 检查项目 构建/编译项目下一步构建工具Flink项目可以使用不同的工具进行管理和编译。sbt和maven建议使用maven,因为目前大数据开发,工作中使用maven的比较多。================mave...

2018-03-10 16:13:49 2827

原创 flink项目开发-java代码模板开发flink指南

java代码开发flink指南必须的依赖 创建项目 检查项目 构建/编译项目 下一步通过几个简单的步骤就可以使用java程序开发flink必须的依赖1:maven3.0.4(或者更高版本)2:java8.x创建项目使用下面的命令创建项目使用maven命令$ mvn archetype:generate ...

2018-03-10 15:52:04 10305

原创 flink原理介绍-数据流编程模型

数据流编程模型抽象级别 程序和数据流 并行数据流 窗口 时间 有状态操作 检查点(checkpoint)容错 批量流处理 下一步抽象级别flink针对 流式/批处理 应用提供了不同的抽象级别。这个最低级别的抽象提供了有状态的流式操作。它是通过处理函数嵌入到DataStream API。它允许用户自由的处理一个或者多个数据流中的事件,并且使用一致,容错的状态。...

2018-03-09 23:04:39 4472 1

原创 flink中文文档-快速开始 安装部署

Flink入门及实战-上:http://edu.51cto.com/sd/07245Flink入门及实战-下:http://edu.51cto.com/sd/5845e下载启动flink 查看代码 运行例子 下一步下载启动flinkflink可以在Linux, Mac OS X, 和Windows平台上运行。为了运行flink,只需要安装JAVA7.x(或者更高版...

2018-03-09 00:01:10 16799

流式数据湖Paimon课程完整课件内容

适合人群: 1、大数据开发岗位 2、大数据分析岗位 3、数据仓库岗位 4、需要构建湖仓一体架构的开发人员 你将会学到: Paimon核心原理及架构 快速上手使用Paimon Paimon中的表类型详解 Paimon的核心操作 Paimon中的CDC数据摄取功能 Hive引擎集成Paimon Paimon底层存储文件深入剖析 Paimon性能优化和管理维护

2023-11-08

数据湖 paimon flink 0.5版本 jar 包

使用Flink操作Paimon 数据湖 时需要用到的jar包。

2023-11-08

徐葳《40小时掌握java语言之09网络编程+正则表达式》内部教材

徐葳【2019版最新】Java基础之09网络编程+正则表达式,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之08IO流》内部教材

【2019版最新】Java基础之08IO,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之07集合》内部教材

【2019版最新】Java基础之07集合,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之06String类》内部教材

【2019版最新】Java基础之06String类,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之05多线程》内部教材

【2019版最新】Java基础之05多线程,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之04继承》内部教材

【2019版最新】Java基础之04继承,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之03面向对象》内部教材

【2019版最新】Java基础之03面向对象,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之02基础语法》内部教材

【2019版最新】Java基础之02基础语法,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

徐葳《40小时掌握java语言之01编程入门》内部教材

【2019版最新】Java基础之01编程入门,本套课程是2019年全新录制,基于目前公司最常用的JDK1.8版本。

2019-03-26

Flink standalone 集群安装步骤-v1.6.1

Flink standalone集群安装步骤-V1.6.1 一主两从的Flink集群安装配置步骤

2018-10-22

Flink HA配置指南文档-v1.6.1

Flink HA 配置文档-V1.6.1,包含Flink Standalone 集群 HA 配置、Flink on yarn 集群 HA 配置

2018-10-22

Flink入门及实战V1.6.1-2018最新

Flink入门及实战最新内容分享,包含Flink基本原理及应用场景、Flink vs storm vs sparkStreaming、Flink入门案例-wordCount、Flink集群安装部署standalone+yarn、Flink-HA高可用、Flink scala shell代码调试

2018-10-22

xmlSchema参考手册(免费分享)

xmlSchema参考手册 (免费分享)

2012-12-13

svn插件(装在myeclipse中的)免费共享

免费共享,解压之后把内容拷到myeclipse中的dropins目录中就可以了

2012-11-24

ajax教程chm帮助文档

ajax教程chm帮助文档,免费下载,希望能够帮到您,

2012-10-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除