大数据概念
文章平均质量分 90
大大大大肉包
一个喜欢计算机的帅小伙
展开
-
Flink中的时间语义和TTL
事件时间是数据生成的时间,是数据流中每个元素或者每个事件自带的时间属性,一般是事件发生的时间,在实际项目中作为前端的一个属性嵌入。在理想情况下,数据应当按照事件时间顺序到达集群节点,但是由于从产生一条数据到数据抵达集群有过多的中间步骤,一个较早发生的事件可能较晚到达,使用事件时间意味着会产生数据乱序。原创 2024-01-30 09:33:12 · 1159 阅读 · 0 评论 -
hadoop 2.x和hadoop 3.x的比较
Hadoop3相对于Hadoop2在方面都得到了显著的提升。原创 2023-04-28 17:22:42 · 1463 阅读 · 0 评论 -
数仓、数湖、仓湖一体
数据发展过程原创 2022-09-02 20:34:35 · 552 阅读 · 0 评论