自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 大数据上云迁移解决方案

云迁移方法论/重点

2024-07-16 14:34:49 175

原创 Lambda架构升级Kappa架构

系统架构更加简洁,很多实时需求更多的场景kappa可能是未来数据仓库的一个趋势

2024-05-23 15:48:03 420 2

原创 大数据离线和实时是什么?

离线处理和实时处理的含义

2024-05-23 10:33:12 353

原创 最常用的HQL的参数优化问题

-设置Hive的执行引擎。推荐使用tez或spark来代替默认的mr(MapReduce),因为它们可以提供更好的性能。set: 推荐使用ORC或Parquet--设置是否压缩Hive写入的数据。将此设置为true可以节省存储空间并减少写入时间。set:true;--设置MapReduce作业的输出是否压缩。set--设置为true以启用查询的向量化执行,可以显著提高性能。set和--设置为true以启用表达式求值的缓存,可以减少重复计算。set--设置为true以启用查询执行的并行处理。set。

2024-04-04 07:26:55 652 1

原创 Flink的RocksDB的使用以及问题

在各个节点的磁盘上的,处理数据的时候,Flink 框架负责保证数据项与其对应键的状态之间的一致性匹配。但是当我们(non-key)属性进行数据关联,比如日期,而不是原始键(如 ID),这时就不能直接依赖 Flink 的 keyBy 分区机制来直接访问状态了,因为 keyBy 机制确保的是相同键的数据项会被路由到相同的并行实例。**:因为涉及磁盘IO,SSD是必要的,而且会有缓存,合并和压缩的时候也会对cpu有一定依赖。合并读取和压缩策略:通过智能的读取和压缩策略减少磁盘访问次数和优化存储空间使用。

2024-04-04 07:05:04 324 1

原创 Flink的状态编程和容错机制概念区分

状态(State)和状态后端(State Backend)在 Apache Flink 中是两个密切相关但不同的概念。状态是为了计算,状态后端是容错。确实,状态(State)和状态后端(State Backend)在 Apache Flink 中是两个密切相关但不同的概念。让我们更清晰地区分这两者,以及更详细地探讨状态本身的作用,以及状态后端在其中扮演的角色。

2024-04-04 06:30:06 276

原创 flink跨窗口不能join数据的解决方案

在 Apache Flink 中实现不同窗口之间的 join 并不一定要借助状态来实现,尽管状态是一种常见的实现方式。虽然状态是一种常见的用于处理跨窗口 join 的方法,但在某些情况下,上述方法可能更适合特定的需求或场景。通过在窗口函数中处理不同窗口的数据,你可以实现跨窗口的 join,而不需要显式地管理状态。如果需要同时处理两个输入流,并在其中一个流的事件到达时执行某些操作(例如 join),你可以使用。这个函数可以让你在处理两个流时维护自己的状态,并在需要时进行 join 操作。

2024-03-07 22:11:36 403 1

原创 交换分区的作用和实践

orig_vnpk_early_rcvd_box_qty_1d -- 原始截止日期供应商规格提前1天收货箱数。, orig_vnpk_late_rcvd_box_qty_1d -- 原始截止日期供应商规格超时1天收货箱数。, orig_vnpk_early_rcvd_box_qty -- 原始截止日期供应商规格提前收货箱数。, orig_vnpk_late_rcvd_box_qty -- 原始截止日期供应商规格超时收货箱数。

2024-03-07 22:09:46 844 2

原创 starrocks读hive表无数据

因为hive的元数据可能在starrocks访问的时候,没有读取到,导致空数据。

2023-10-26 22:19:57 146

大数据-常用组件原理-大数据培训

大数据培训资料,涵盖了大数据Haoop,Spark,Flink,StarRocks,Doris,Hive,ES,Hbase等常见lambda架构的组件,适合通用大数据培训,大数据原理介绍和部分代码

2024-06-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除