大数据
nicajonh
编程,学习两大乐事
展开
-
Flink的可靠性保证 – CheckPoint机制
Flink支持Exactly-Once级别的准确行,这是一个很高的要求,一般的高吞吐量系统只支持At-least-Once级别的。Lightweight Asynchronous Snapshots for Distributed Dataflows这篇论文是Checkpointing机制的理论基础,这个机制的思想来源于K.MANI CHANDY和LESLIE LAMPORT 发表的一...转载 2019-12-11 18:19:07 · 370 阅读 · 0 评论 -
电商用户画像
一、 前言大数据时代已经到来,企业迫切希望从已经积累的数据中分析出有价值的东西,而用户行为的分析尤为重要。利用大数据来分析用户的行为与消费习惯,可以预测商品的发展的趋势,提高产品质量,同时提高用户满意度。本课程是基于大型电商公司的真实用户画像中提练出的精华内容,旨在培养学员了解用户画像的内容,掌握构建用户画像的方法。二、 初识用户画像 右边是一个人的基本属性,通过一个人的基本属性我们可以了解...转载 2018-04-27 03:28:56 · 14601 阅读 · 4 评论 -
强力推荐flink流式引擎入门
这篇文章强力推荐,介绍flink流式引擎比较细致 Flink 认为 Batch 是 Streaming 的一个特例,所以 Flink 底层引擎是一个流式引擎,在上面实现了流处理和批处理。而窗口(window)就是从 Streaming 到 Batch 的一个桥梁。Flink 提供了非常完善的窗口机制,这是我认为的 Flink 最大的亮点之一(其他的亮点包括消息乱序处理,和 checkpoint ...转载 2019-04-01 12:02:40 · 1205 阅读 · 0 评论