自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【Flink】部署模式-会话模式/单作业模式/应用模式/Yarn模式/独立模式/K8s模式

在一些应用场景中,对于集群资源分配和占用的方式,可能会有特定的需求。Flink为各种场景提供了不同的部署模式,主要有以下三种模式:会话模式(Session Mode)单作业模式(Per-Job Mode)应用模式(Application Mode)

2023-03-02 22:41:34 628

原创 【数据结构】LSM树(log-structed-merge-tree)原理及应用

LSM 树的思想是使用顺序写代替随机写来提高写性能,与此同时会略微降低读性能。HBase、 Cassandra、 LevelDB、 RocksDB 以及 ClickHouse MergeTree 等流行的 NoSQL 数据库均采用 LSM 存储结构。

2023-03-02 16:52:14 997

原创 布隆过滤器(Bloom Filter)详解,以及Java代码实现

布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难

2023-03-02 15:14:18 2863

原创 【数据集成】数据集成的发展和未来

构建一个中心化的数据仓库本身是一个艰巨的任务,每个数据源都需要单独的程序和工具来摄取、清洗和导入数据。数据仓库的数据一般来源于多个分散的、异构的数据源,通过数据集成技术将数据整合在一起,消除数据孤岛,便于后续的分析。近年来,面向分析的数据系统发展迅速,各种新型的 OLAP 系统开始显露锋芒,数据湖和 Lakehouse 的概念也变得炙手可热。然而诸如 Canal 等专注于纯增量数据为用户想要集成的数据从来不是单独的历史数据部分,或是单独的增量数据部分,而是历史数据和增量数据一体化地集成到数据仓库。

2022-10-21 10:58:25 965 1

原创 【设计模式】代理模式-原理、实现以及应用场景

代理模式(Proxyy)就是在不改变原始类(或叫做被代理类)代码的情况下,通过引入代理类来给原始类附加功能。

2022-07-20 11:21:07 3281

原创 【设计模式】设计模式的分类-创建型模式、结构型模式、行为型模式

介绍设计模式的分类:创建型模式、结构型模式、行为型模式以及他们之间的含义和区别

2022-07-19 22:35:04 213

原创 【维度建模】维度模型设计详细步骤

数据仓库建设过程中,维度建模的详细步骤和要注意的点

2022-07-14 16:50:43 3574

原创 【datart】Docker部署datart并支持Clickhouse数据源连接

docker部署datart,并支持clickhouse 数据源连接

2022-07-14 16:25:40 1775 2

原创 【datart】数据可视化工具datart在IDEA中进行代码调试

datart在idea中进行代码调试

2022-07-13 13:51:36 1525 2

Hbase布隆过滤器详解

介绍布隆过滤器的原理,实现,结构,优缺点,以及误判率估计和最优哈希个数,其中还有含有公式的详细推到过程。

2023-03-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除