自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

syhiiu的博客

一个没有感情的程序员

  • 博客(75)
  • 收藏
  • 关注

原创 数开中:SQL递归函数使用场景(70天)

本文通过案例解析:数仓(Data Warehouse)中,SQL递归函数的使用场景

2024-08-20 07:15:00 934 14

原创 flink车联网项目:维表离线同步(第69天)

本文为flink车联网项目:维表离线同步,后续章节为:ods层具体实现。

2024-08-19 07:15:00 1520 16

原创 flink车联网项目:业务实现2(维表开发)(第68天)

本文为flink车联网项目:业务实现2(维表开发),后续章节为:维表离线同步。

2024-08-18 15:59:24 1296 11

原创 flink车联网项目前篇:业务实现1(第67天)

本文为flink车联网项目:业务实现1,后续章节为:维表开发

2024-08-17 07:15:00 2550 53

原创 flink车联网项目前篇:数据开发(第66天)

本文为flink车联网项目前期准备:数据仓库开发。由于篇幅过长,后续章节:业务实现。

2024-08-16 09:58:24 2874 70

原创 flink车联网项目前篇:建模设计(第65天)

本文主要详解了维度建模和flink车联网项目的建模设计。由于篇幅过长,后续章节:数据开发。

2024-08-14 12:10:36 2122 28

原创 flink车联网项目前篇:项目设计(第64天)

本文介绍车联网项目设计,数仓分层,数仓主题,数据建模。

2024-08-13 18:17:42 1822 24

原创 数据仓库详解(第63天)

本文为Flink-业务开发章节前篇:数据仓库设计详解。后续章节:Flink实战车联网项目数仓设计。

2024-08-12 07:15:00 2337 39

原创 Flink-DataWorks第六部分:数据运维(第62天)

本文主要详解了DataWorks的数据运维.

2024-08-11 07:08:30 1929 26

原创 Flink-DataWorks第五部分:数据开发(第61天)

本文主要详解了DataWorks的数据开发(后续),为第五部分:由于篇幅过长,分章节进行发布。后续: 数据运维

2024-08-10 07:15:00 1647 31

原创 Flink-DataWorks第四部分:数据同步(第60天)

本文主要详解了DataWorks的数据同步,为第四部分:由于篇幅过长,分章节进行发布。后续: 数据开发。

2024-08-09 07:15:00 3419 48

原创 Flink-DataWorks第三部分:数据集成(第59天)

本文主要详解了DataWorks的数据开发流程及操作,为第三部分:由于篇幅过长,分章节进行发布。后续: 运维中心的使用。

2024-08-08 07:09:12 2420 46

原创 Flink-DataWorks第二部分:数据集成(第58天)

本文主要详解了DataWorks的数据集成,为第二部分:由于篇幅过长,分章节进行发布。后续: 数据集成的使用 数据开发流程及操作 运维中心的使用。

2024-08-07 07:15:00 2637 51

原创 Flink-DataWorks第一部分:DataWorks(第57天)

本文主要详解了DataWorks基本功能,为第一部分:由于篇幅过长,分章节进行发布。后续: 数据集成的使用 数据开发流程及操作 运维中心的使用

2024-08-06 07:15:00 3338 77

原创 Flink-StarRocks详解:第六部分-即席查询大案例解析(第56天)

本文为Flink-StarRocks详解后续章节:主要详解StarRocks数仓场景:即席查询大案例

2024-08-05 07:15:00 1722 47

原创 Flink-StarRocks详解:第五部分查询数据湖(第55天)

本文为Flink-StarRocks详解后续章节:主要详解StarRocks查询数据湖由于篇幅过长,后续接着下面进行详解:数仓场景:即席查询大案例

2024-08-04 07:15:00 3552 76

原创 Flink-StarRocks详解:第四部分StarRocks分区管理,数据压缩(第54天)

本文为Flink-StarRocks详解后续章节:主要详解StarRocks分区分桶管理,数据压缩,由于篇幅过长,后续接着下面进行详解: StarRocks查询数据湖 实现即席查询案例。

2024-08-03 08:03:38 3088 69

原创 Flink-StarRocks详解:第三部分StarRocks分区分桶(第53天)

本文为Flink-StarRocks详解后续章节:主要详解StarRocks分区分桶由于篇幅过长,后续接着下面进行详解: StarRocks查询数据湖 实现即席查询案例需要显式列出每个 List 分区所包含的枚举值列表,并且值不需要连续,区别于包含连续日期或者数值范围的 Range 分区。当新数据导入表中时,StarRocks 会根据数据的分区列值与分区的映射关系将数据分配到相应的分区中。List 分区适用于存储具有少量枚举值列的数据、并且经常按列的枚举值来查询和管理数据的场景。

2024-08-02 07:15:00 2019 47

原创 Flink-StarRocks详解:第二部分(第52天)

本文为Flink-StarRocks详解后续章节:主要详解StarRocks表设计,聚合,更新,主键三大数据模型。由于篇幅过长,后续接着下面进行详解: StarRocks分区分桶 StarRocks查询数据湖 实现即席查询案例。

2024-08-01 07:15:00 3577 95

原创 Flink-StarRocks详解:第一部分(第51天)

本文主要详解StarRocks系统架构,适用场景,产品特性。StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。

2024-07-31 07:15:00 1691 59

原创 大数据开发高频面试题:(第50天)

本文总结了大数据开发常规高频面试题。后面会出,系列面试题,涉及到hive,spark离线数仓,实时flink以及kafka,es,等技术栈专项面试题。

2024-07-30 07:15:00 1214 22

原创 Paimon数据湖详解(第49天)

本文主要详解了Paimon数据湖的使用。

2024-07-29 07:15:00 1710 19

原创 湖仓一体架构解析:数仓架构选择(第48天)

本文解析了Lambda 架构,Kappa 架构,以及在大数据场景中,如何选择架构。

2024-07-28 07:30:00 6411 98

原创 Flink-CDC解析(第47天)

本文主要概述了Flink-CDC

2024-07-27 07:15:00 8002 109

原创 大数据在网约车行业应用(46天)

大数据在网约车行业应用

2024-07-26 07:15:00 1645 45

原创 数仓架构解析(第45天)

经典数仓架构,传统离线大数据架构背景解析。

2024-07-25 15:28:23 1522 9

原创 Flink-窗口详解:(第44天)

Apache Flink的窗口机制是处理实时流数据的关键功能之一,它允许开发者将数据流切分成有限的“块”(或称为“窗口”),并在这些块上执行计算。本文对Flink窗口机制的详细解析,并结合具体例子进行分析。

2024-07-23 07:15:00 1506 25

原创 Flink架构底层原理详解:案例解析(43天)

本文主要详解了Flink架构,通过案例详解Flink流式开发,本地提交,阿里云平台提交。

2024-07-22 07:15:00 5445 53

原创 Flink调优详解:案例解析(第42天)

本文主要详解常见的Flink优化策略。

2024-07-21 07:15:00 6177 81

原创 Flink-Checkpoint机制详解:(第41天)

本文通过案例方式详解-Flink-Checkpoint机制。

2024-07-20 07:15:00 3095 67

原创 MYSQL调优详解:案例解析(第40天)

MySQL的优化是一个涉及多个层面的复杂过程,主要包括数据库设计优化、查询优化、架构优化等。本文通过案例方式详解关键的MySQL优化策略。

2024-07-19 09:41:12 1891 64

原创 Flink-Watermark机制详解:(第39天)

Watermark机制,在Apache Flink这样的流处理框架中,扮演着至关重要的角色,特别是在处理事件时间(Event Time)窗口时,它能够有效解决数据乱序和延迟到达的问题,本文对Watermark机制的详细解析,涵盖其定义、原理、应用场景、核心算法以及优化策

2024-07-19 07:15:00 1943 35

原创 数仓建模详解:电商案例解析(第38天)

数仓建模过程是一个复杂但系统化的工作,它涉及多个步骤,从需求分析到数据仓库的设计、构建和维护。本文我将结合实例详细解释数仓建模过程。

2024-07-18 07:15:00 1680 55

原创 Flink底层原理解析:案例解析(第37天)

Apache Flink 是一个开源的流处理框架,用于处理无界和有界数据流。其底层原理复杂而精细,涉及到数据流模型、任务调度与执行、内存管理、容错机制等多个方面。本文是对 Flink 底层原理的详细分析,并通过举例来说明这些原理。

2024-07-17 17:29:26 4048 76

原创 如何在csdn上天天上热榜

一、一周8篇热榜,我是咋做到的二、csdn如何现才能上热榜,文章需要咋写三、如何在csdn上发表高质量文章。

2024-07-16 07:00:00 1569 49

原创 Hadoop数仓中常用端口详解:(第36天)

在数仓(数据仓库)开发中,不同的组件和服务会使用不同的端口号进行通信。由于数仓的实现可能依赖于多种技术和框架(如Hadoop、Hive、HBase、Spark等),因此涉及的端口号也会有所不同。以下是一些数仓开发中常用端口号及其作用的概述,以及相关的操作指令建议。常用端口号及其作用。

2024-07-15 07:15:00 2855 61

原创 Spark调度底层执行原理详解(第35天)

Spark调度底层执行原理是一个复杂而精细的过程,它涉及到多个组件的交互和协同工作,以实现大数据处理的高效性和灵活性。本文主要对Spark调度底层执行原理进行详细解析。

2024-07-14 07:15:00 2318 50

原创 Spark底层原理:案例解析(第34天)

Apache Spark是一个快速、通用、基于内存的分布式计算引擎,专为大规模数据处理而设计。其架构设计体现了高度的模块化和可扩展性,支持多种数据处理模式,包括批处理、实时流处理、交互式查询、机器学习和图计算等。以下将详细介绍Spark的架构设计,并结合具体例子进行分析。

2024-07-13 08:12:13 3132 55

原创 yarn底层原理详解:(第33天)

本文主要详解了Hadoop中Yarn的底层原理。

2024-07-12 07:00:00 1720 61

原创 MapReduce底层原理详解:大案例解析(第32天)

MapReduce(简称MR)是Hadoop框架中的一个核心组件,它主要用于大规模数据集的并行处理。MapReduce的底层原理涉及数据的分片、Map阶段的处理、Shuffle过程以及Reduce阶段的处理等多个环节。本文通过案例解析方式对MR底层原理进行详细解析

2024-07-11 07:15:00 1694 55

Pandas数据可视化详解:大案例解析(第27天)

Pandas数据可视化详解:大案例解析(第27天)

2024-07-05

Spark sql 第6天电影案例分析所需文件

Spark sql 第6天电影案例分析所需文件

2024-06-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除