自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_50538648的博客

原创 Flink状态管理

Flink状态管理State分类：ManagedState:被Flink管理的State,Flink对他有自己的管理和优化,绝大多数情况适用，RawState:需要手动管理…自定义Operator的时候需要，KeyedState：分组操作、OperatorState：有无分组的Operator都可以用；KeyedState：/** * 需求:使用KeyedState维护历史状态(历史值),获取输入数据的最大值 * 注意:我们只是为了演示KeyedState,实际中可以直接使用Flink提供好

2020-09-08 15:05:02 146

原创 Flink内存管理

Flink内存管理1.1问题引入Flink本身基本是以Java语言完成的，理论上说，直接使用JVM的虚拟机的内存管理就应该更简单方便，但Flink还是单独抽象出了自己的内存管理因为Flink是为大数据而产生的，而大数据使用会消耗大量的内存，而JVM的内存管理管理设计是兼顾平衡的，不可能单独为了大数据而修改，这对于Flink来说，非常的不灵活，而且频繁GC会导致长时间的机器暂停应用，这对于大数据的应用场景来说也是无法忍受的。JVM在大数据环境下存在的问题:1.Java 对象存储密度低。在HotSpo

2020-09-03 15:02:25 373

原创 Spark内存管理

Spark内存管理1.1.堆内内存和堆外内存1.1.1.堆内内存(on-heap)在JVM堆上分配的内存，在JVM垃圾回收GC范围内①：Driver堆内存：通过–driver-memory 或者spark.driver.memory指定，默认大小1G；②：Executor堆内存：通过–executor-memory 或者spark.executor.memory指定，默认大小1G在提交一个Spark Application时，Spark集群会启动Driver和Executor两种JVM进程。

2020-09-03 14:56:25 2613

挖掘类标签开发案例_.mp4

挖掘类标签即算法类标签，需要用算法挖掘用户相关特征。挖掘类标签开发环节包括：①用户行为特征工程开发、②算法调优、③上线工程化调度等环节，开发周期较长。

2020-09-03

搭建虚拟机开发环境及节点间互信.mp4

搭建虚拟机开发环境及节点间互信共享目录说明：同步宿主主机文件到虚拟机：官网文档位置：https://www.vagrantup.com/docs/synced-folders/basic_usage.html Windows配置用SMB配置共享目录官网文档位置：https://www.vagrantup.com/docs/synced-folders/smb.html LinuxNFS：https://www.vagrantup.com/docs/synced-folders/nfs.html

2020-09-03

机器学习经典算法视频

转，大数据经典算法视频，PageRank，K-Means算法，.CART:分类与回归树，C4.5，最大期望(EM)算法

2020-09-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

ZrT刺史 CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：日本

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

3: 原创

129万+: 周排名

189万+: 总排名

3129: 访问

: 等级

31: 积分

0: 粉丝

1: 获赞

0: 评论

12: 收藏

私信

关注

热门文章

最新文章

提示

确定要删除当前文章？

取消删除