自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

syhiiu的博客

一个没有感情的程序员

原创数开中：SQL递归函数使用场景（70天）

本文通过案例解析：数仓（Data Warehouse）中，SQL递归函数的使用场景

2024-08-20 07:15:00 1254 15

原创 flink车联网项目：维表离线同步（第69天）

本文为flink车联网项目：维表离线同步，后续章节为：ods层具体实现。

2024-08-19 07:15:00 1852 17

原创 flink车联网项目：业务实现2（维表开发）（第68天）

本文为flink车联网项目：业务实现2(维表开发)，后续章节为：维表离线同步。

2024-08-18 15:59:24 1528 12

原创 flink车联网项目前篇：业务实现1（第67天）

本文为flink车联网项目：业务实现1，后续章节为：维表开发

2024-08-17 07:15:00 4328 54

原创 flink车联网项目前篇：数据开发（第66天）

本文为flink车联网项目前期准备：数据仓库开发。由于篇幅过长，后续章节：业务实现。

2024-08-16 09:58:24 4602 71

原创 flink车联网项目前篇：建模设计（第65天）

本文主要详解了维度建模和flink车联网项目的建模设计。由于篇幅过长，后续章节：数据开发。

2024-08-14 12:10:36 2356 29

原创 flink车联网项目前篇：项目设计（第64天）

本文介绍车联网项目设计，数仓分层，数仓主题，数据建模。

2024-08-13 18:17:42 2108 25

原创数据仓库详解（第63天）

本文为Flink-业务开发章节前篇：数据仓库设计详解。后续章节：Flink实战车联网项目数仓设计。

2024-08-12 07:15:00 2723 40

原创 Flink-DataWorks第六部分：数据运维（第62天）

本文主要详解了DataWorks的数据运维.

2024-08-11 07:08:30 2238 27

原创 Flink-DataWorks第五部分：数据开发（第61天）

本文主要详解了DataWorks的数据开发（后续），为第五部分：由于篇幅过长，分章节进行发布。后续： 数据运维

2024-08-10 07:15:00 2043 32

原创 Flink-DataWorks第四部分：数据同步（第60天）

本文主要详解了DataWorks的数据同步，为第四部分：由于篇幅过长，分章节进行发布。后续： 数据开发。

2024-08-09 07:15:00 5656 50

原创 Flink-DataWorks第三部分：数据集成（第59天）

本文主要详解了DataWorks的数据开发流程及操作，为第三部分：由于篇幅过长，分章节进行发布。后续： 运维中心的使用。

2024-08-08 07:09:12 2963 47

原创 Flink-DataWorks第二部分：数据集成（第58天）

本文主要详解了DataWorks的数据集成，为第二部分：由于篇幅过长，分章节进行发布。后续： 数据集成的使用 数据开发流程及操作 运维中心的使用。

2024-08-07 07:15:00 4145 52

原创 Flink-DataWorks第一部分：DataWorks（第57天）

本文主要详解了DataWorks基本功能，为第一部分：由于篇幅过长，分章节进行发布。后续： 数据集成的使用 数据开发流程及操作 运维中心的使用

2024-08-06 07:15:00 5019 78

原创 Flink-StarRocks详解:第六部分-即席查询大案例解析(第56天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks数仓场景：即席查询大案例

2024-08-05 07:15:00 2038 48

原创 Flink-StarRocks详解:第五部分查询数据湖(第55天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks查询数据湖由于篇幅过长，后续接着下面进行详解：数仓场景：即席查询大案例

2024-08-04 07:15:00 5294 77

原创 Flink-StarRocks详解:第四部分StarRocks分区管理，数据压缩(第54天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks分区分桶管理，数据压缩，由于篇幅过长，后续接着下面进行详解： StarRocks查询数据湖 实现即席查询案例。

2024-08-03 08:03:38 4920 70

原创 Flink-StarRocks详解:第三部分StarRocks分区分桶(第53天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks分区分桶由于篇幅过长，后续接着下面进行详解： StarRocks查询数据湖 实现即席查询案例需要显式列出每个 List 分区所包含的枚举值列表，并且值不需要连续，区别于包含连续日期或者数值范围的 Range 分区。当新数据导入表中时，StarRocks 会根据数据的分区列值与分区的映射关系将数据分配到相应的分区中。List 分区适用于存储具有少量枚举值列的数据、并且经常按列的枚举值来查询和管理数据的场景。

2024-08-02 07:15:00 3328 48

原创 Flink-StarRocks详解:第二部分(第52天)

本文为Flink-StarRocks详解后续章节：主要详解StarRocks表设计，聚合，更新，主键三大数据模型。由于篇幅过长，后续接着下面进行详解： StarRocks分区分桶 StarRocks查询数据湖 实现即席查询案例。

2024-08-01 07:15:00 6478 97

原创 Flink-StarRocks详解:第一部分(第51天)

本文主要详解StarRocks系统架构，适用场景，产品特性。StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理，就可以用 StarRocks 来支持多种数据分析场景的极速分析。

2024-07-31 07:15:00 2450 60

原创大数据开发高频面试题：（第50天）

本文总结了大数据开发常规高频面试题。后面会出，系列面试题，涉及到hive,spark离线数仓，实时flink以及kafka,es,等技术栈专项面试题。

2024-07-30 07:15:00 2311 22

原创 Paimon数据湖详解（第49天）

本文主要详解了Paimon数据湖的使用。

2024-07-29 07:15:00 2948 19

原创湖仓一体架构解析：数仓架构选择（第48天）

本文解析了Lambda 架构，Kappa 架构，以及在大数据场景中，如何选择架构。

2024-07-28 07:30:00 8858 99

原创 Flink-CDC解析（第47天）

本文主要概述了Flink-CDC

2024-07-27 07:15:00 9263 111

原创大数据在网约车行业应用（46天）

大数据在网约车行业应用

2024-07-26 07:15:00 2327 46

原创数仓架构解析（第45天）

经典数仓架构，传统离线大数据架构背景解析。

2024-07-25 15:28:23 1611 9

原创 Flink-窗口详解:(第44天)

Apache Flink的窗口机制是处理实时流数据的关键功能之一，它允许开发者将数据流切分成有限的“块”（或称为“窗口”），并在这些块上执行计算。本文对Flink窗口机制的详细解析，并结合具体例子进行分析。

2024-07-23 07:15:00 1672 26

原创 Flink架构底层原理详解：案例解析（43天）

本文主要详解了Flink架构，通过案例详解Flink流式开发，本地提交，阿里云平台提交。

2024-07-22 07:15:00 7786 53

原创 Flink调优详解：案例解析（第42天）

本文主要详解常见的Flink优化策略。

2024-07-21 07:15:00 8927 81

原创 Flink-Checkpoint机制详解：(第41天)

本文通过案例方式详解-Flink-Checkpoint机制。

2024-07-20 07:15:00 5399 67

原创 MYSQL调优详解：案例解析（第40天）

MySQL的优化是一个涉及多个层面的复杂过程，主要包括数据库设计优化、查询优化、架构优化等。本文通过案例方式详解关键的MySQL优化策略。

2024-07-19 09:41:12 4046 64

原创 Flink-Watermark机制详解：(第39天)

Watermark机制，在Apache Flink这样的流处理框架中，扮演着至关重要的角色，特别是在处理事件时间（Event Time）窗口时，它能够有效解决数据乱序和延迟到达的问题，本文对Watermark机制的详细解析，涵盖其定义、原理、应用场景、核心算法以及优化策

2024-07-19 07:15:00 2381 37

原创数仓建模详解：电商案例解析（第38天）

数仓建模过程是一个复杂但系统化的工作，它涉及多个步骤，从需求分析到数据仓库的设计、构建和维护。本文我将结合实例详细解释数仓建模过程。

2024-07-18 07:15:00 2267 55

原创 Flink底层原理解析：案例解析（第37天）

Apache Flink 是一个开源的流处理框架，用于处理无界和有界数据流。其底层原理复杂而精细，涉及到数据流模型、任务调度与执行、内存管理、容错机制等多个方面。本文是对 Flink 底层原理的详细分析，并通过举例来说明这些原理。

2024-07-17 17:29:26 5310 77

原创 Hadoop数仓中常用端口详解:(第36天)

在数仓（数据仓库）开发中，不同的组件和服务会使用不同的端口号进行通信。由于数仓的实现可能依赖于多种技术和框架（如Hadoop、Hive、HBase、Spark等），因此涉及的端口号也会有所不同。以下是一些数仓开发中常用端口号及其作用的概述，以及相关的操作指令建议。常用端口号及其作用。

2024-07-15 07:15:00 4310 62

原创 Spark调度底层执行原理详解（第35天）

Spark调度底层执行原理是一个复杂而精细的过程，它涉及到多个组件的交互和协同工作，以实现大数据处理的高效性和灵活性。本文主要对Spark调度底层执行原理进行详细解析。

2024-07-14 07:15:00 3443 50

原创 Spark底层原理：案例解析（第34天）

Apache Spark是一个快速、通用、基于内存的分布式计算引擎，专为大规模数据处理而设计。其架构设计体现了高度的模块化和可扩展性，支持多种数据处理模式，包括批处理、实时流处理、交互式查询、机器学习和图计算等。以下将详细介绍Spark的架构设计，并结合具体例子进行分析。

2024-07-13 08:12:13 4264 55

原创 yarn底层原理详解:(第33天)

本文主要详解了Hadoop中Yarn的底层原理。

2024-07-12 07:00:00 2309 61

原创 MapReduce底层原理详解：大案例解析（第32天）

MapReduce（简称MR）是Hadoop框架中的一个核心组件，它主要用于大规模数据集的并行处理。MapReduce的底层原理涉及数据的分片、Map阶段的处理、Shuffle过程以及Reduce阶段的处理等多个环节。本文通过案例解析方式对MR底层原理进行详细解析

2024-07-11 07:15:00 2065 55

原创 hdfs大规模数据存储底层原理详解（第31天）

本文主要对HDFS如何做到大规模数据存储的详细说明，包括其设计原理、架构、关键技术以及应用实例，

2024-07-10 07:00:00 3241 55

Pandas数据可视化详解:大案例解析（第27天）

Pandas数据可视化详解:大案例解析（第27天）

2024-07-05

Spark sql 第6天电影案例分析所需文件

Spark sql 第6天电影案例分析所需文件

2024-06-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

博客等级

码龄8年

74
原创

3893
点赞

2678
收藏

5315
粉丝

关注

私信

热门文章

分类专栏

sql 3篇
感悟
flink 29篇
活动
大数据开发面试题 1篇
spark学习 11篇
hadoop 10篇
kafka 4篇
数据分析 6篇
Linux 2篇
python 1篇

最新评论

Flink-Watermark机制详解：(第39天)
L.S.Adam: 报错 Cannot discover a connector using option: 'connector'='socket' 没有这个连接器啊，需要导什么包吗？
Flink-CDC解析（第47天）
singleZhang2010: 如何获取数据的变更类型是新增更新还是删除，推送给kafka通知下游系统消费这个变更通知呢
Flink-DataWorks第四部分：数据同步（第60天）
2401_88899932: 你好，我想直接从一个oracle库的数据直接抽到mysql数据库，数据去向写mysql数据源，这样如何实现增量同步呢
flink车联网项目前篇：业务实现1（第67天）
Ivy@HPC: 这篇文章真是干货满满，作者对技术细节的把握和解析非常到位，让我对这个主题有了更深入的理解。期待作者能分享更多这样的高质量内容！
Flink-CDC解析（第47天）
DebugDiva: 这篇文章真是干货满满，作者对技术细节的把握和解析非常到位，让我对这个主题有了更深入的理解。期待作者能分享更多这样的高质量内容！

提示

确定要删除当前文章？

取消删除