公子乂
码龄8年
关注
提问 私信
  • 博客:73,205
    73,205
    总访问量
  • 76
    原创
  • 40,475
    排名
  • 654
    粉丝
  • 0
    铁粉

个人简介:我很懒,什么都不想写。。。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河北省
  • 加入CSDN时间: 2016-10-13
博客简介:

qq_36382892的博客

查看详细资料
  • 原力等级
    当前等级
    4
    当前总分
    768
    当月
    1
个人成就
  • 获得851次点赞
  • 内容获得14次评论
  • 获得541次收藏
  • 代码片获得581次分享
创作历程
  • 62篇
    2024年
  • 14篇
    2023年
成就勋章
兴趣领域 设置
  • Java
    java
  • 大数据
    hbasehivekafkaflink
  • 移动开发
    android
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

HDFS异常org.apache.hadoop.hdfs.protocol.NSQuotaExceededException

例如,使用 hdfs dfsadmin -setSpaceQuota 和 hdfs dfsadmin -setQuota 来调整空间和文件数量的配额。:使用 HDFS 命令(如 hdfs dfs -count -q )检查相关目录的配额设置,了解当前的文件数量和存储空间使用情况。从该继承体系可知HDFS支持多种限额配置,如“路径长度限制”、“目录数限额”、“文件数限额”、“存储空间限额”等。:如果文件数量或存储空间超过了配额,可以考虑删除一些不必要的文件,释放空间。
原创
发布博客 2024.10.23 ·
483 阅读 ·
5 点赞 ·
0 评论 ·
10 收藏

Flink本地idea运行环境配置webui

地址:http://localhost:8081/#/overview。
原创
发布博客 2024.05.27 ·
939 阅读 ·
6 点赞 ·
0 评论 ·
4 收藏

Flink 报错 Exception: Could not create actor system

原因:依赖包中的 scala 版本不匹配,需要 pom.xml 文件统一 scala 版本,重新载入依赖包解决。
原创
发布博客 2024.05.27 ·
698 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink状态数据结构升级

目前,仅支持 POJO 和 Avro 类型的 schema 升级 因此,如果你比较关注于状态数据结构的升级,那么目前来看强烈推荐使用 Pojo 或者 Avro 状态数据类型。一个例外是如果新的 Avro 数据 schema 生成的类无法被重定位或者使用了不同的命名空间,在作业恢复时状态数据会被认为是不兼容的。Flink 完全支持 Avro 状态类型的升级,只要数据结构的修改是被 Avro 的数据结构解析规则认为兼容的即可。
原创
发布博客 2024.05.22 ·
540 阅读 ·
10 点赞 ·
0 评论 ·
5 收藏

Flink报错Checkpoint expired before completing

这个报错告警是由于在Flink作业执行过程中,触发或完成检查点(Checkpoint)的过程中,出现了检查点超时未能完成的情况。:确保作业运行时有足够的资源可用,如CPU、内存等,避免资源不足导致作业执行缓慢,进而影响检查点的完成时间。:可以通过调整Flink作业的配置参数,增加检查点的超时时间,以适应作业执行过程中可能出现的耗时操作。:对作业的任务和操作进行性能优化,减少耗时操作,提高作业执行效率,从而减少检查点的时间消耗。
原创
发布博客 2024.05.22 ·
632 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink Task 性能指标

这些指标每两秒更新一次,上报的值表示 Subtask 在最近两秒被反压 (或闲或忙) 的平均时长。当你的工作负荷是变化的时需要尤其引起注意。比如,一个以恒定 50% 负载工作的 Subtask 和另一个每秒钟在满负载和闲置切换的 Subtask 的 busyTimeMsPerSecond 值相同,都是 500ms.backPressureTimeMsPerSecond: Subtask 被反压的时间。busyTimeMsPerSecond: Subtask 实际的工作时间。
原创
发布博客 2024.05.20 ·
408 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

Can‘t commit changes from multiple changelists at once

参考资料:https://foojay.io/today/intellij-idea-changelists-and-git-staging/同时选中时会导致此故障。需要把不是当前需要提交的。可以使用 Undo Commit 撤回本地提交的。由于 idea 一次只能提交一个更改列表(取消,或者合并为一个。
原创
发布博客 2024.05.20 ·
959 阅读 ·
7 点赞 ·
0 评论 ·
0 收藏

Hive判空函数 COALESCE 和 NVL 使用示例

COALESCECOALESCE函数用于返回参数列表中第一个非NULL的数值或表达式。语法: COALESCE(value1, value2, …) ,参数可以是多个数值或表达式。返回值:返回参数列表中第一个非NULL的数值或表达式,如果所有参数均为NULL,则返回NULL。示例: SELECT COALESCE(column1, column2, ‘N/A’) AS result FROM table_name;NVLNVL函数用于将NULL值替换为指定的默认值。
原创
发布博客 2024.04.28 ·
4116 阅读 ·
11 点赞 ·
2 评论 ·
9 收藏

Hive EXPLAIN 执行计划解析

阶段本身的描述显示了一系列运算符及与运算符相关的元数据。在本示例中有2个map/reduce阶段(Stage-1和Stage-2)和1个与文件系统相关的阶段(Stage-0)。这些阶段可以是map/reduce阶段,也可以是执行元数据存储库或文件系统操作(如移动和重命名)的阶段。这个SQL查询的作用是从表src中选择key字段,并对每个key对应的value字段进行截取后求和,然后将结果插入到目标表dest_g1中。每个“+”表示一个按升序排序的列,每个“-”表示一个按降序排序的列。
原创
发布博客 2024.04.28 ·
840 阅读 ·
9 点赞 ·
3 评论 ·
9 收藏

Hive官方文档 join table 总结

总的来说,Hive中的表join操作提供了多种方式来连接不同表之间的数据,包括内连接、外连接、半连接等,开发者可以根据具体需求选择合适的join操作来实现数据的关联和合并。
原创
发布博客 2024.04.23 ·
472 阅读 ·
5 点赞 ·
2 评论 ·
4 收藏

Hive侧视图 LATERAL VIEW 和 LATERAL VIEW OUTER 使用示例

在第一个查询中,由于 Jack 的 actions 字段为 NULL ,所以在使用 LATERAL VIEW 展开时,不会生成任何新的行。而在第二个查询中,使用 LATERAL VIEW OUTER 能够处理 NULL 值情况,保留了 Jack 的原始行并将 action 字段设为 NULL。值情况,确保展开操作的稳健性。根据具体情况和需求,可以选择合适的关键字来展开数据类型以便在查询中使用。都用于在Hive中展开复杂数据类型的字段,但。
原创
发布博客 2024.04.23 ·
846 阅读 ·
11 点赞 ·
0 评论 ·
4 收藏

Hive字符串匹配函数 LIKE 和 RLIKE 使用示例

LIKELIKE 函数用于在Hive中进行简单的模式匹配,通常用于匹配固定模式的字符串。语法: column_nameLIKE‘pattern’示例: SELECT * FROM table_name WHERE column_nameLIKE‘abc%’在 LIKE 中,通配符表示匹配任意数量的字符(包括空字符),表示匹配任意单个字符。RLIKERLIKE 函数用于在Hive中进行正则表达式匹配,可以实现更灵活的模式匹配。语法: column_nameRLIKE‘pattern’
原创
发布博客 2024.04.18 ·
1780 阅读 ·
5 点赞 ·
1 评论 ·
4 收藏

Flink KafkaSink分区配置的不同版本对比

总结:根据Flink 官方文档提供的信息,可见Flink不同版本在处理写Kafka分区的默认配置是有区别的: 1. Flink版本 >=1.12: - 默认情况下,Flink使用Kafka默认分区器来对消息进行分区。 也就是 kafka 的粘性分区策略2. Flink版本
原创
发布博客 2024.04.18 ·
1299 阅读 ·
22 点赞 ·
1 评论 ·
20 收藏

Flink SQL 自定义函数 - 字符串拆分

/ 实现eval方法,用于拆分输入字符串并输出每个子串if (str!= null) {// 使用指定正则表达式对输入字符串进行拆分// 使用collect(...)方法发射一行数据。
原创
发布博客 2024.04.16 ·
1214 阅读 ·
14 点赞 ·
0 评论 ·
6 收藏

Hudi 表支持多种查询引擎对比

Apache Hudi有两种主要的表类型,分别是Copy on Write(COW)表和Merge on Read(MOR)表。COWMORCOW。
原创
发布博客 2024.04.16 ·
458 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

java 解析 xml 字符串转换为实体,实体转换为 xml 字符串

【代码】java 解析 xml 字符串转换为实体,实体转换为 xml 字符串。
原创
发布博客 2024.04.12 ·
924 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

Hudi 如何运行 MOR 表的压缩?

运行MOR表的压缩最简单的方法是在内联模式下运行压缩,以花费更多时间进行摄入;这在常见情况下特别有用,即您有少量滞后数据流入旧分区。在这种情况下,您可能希望在等待足够的日志积累到旧分区时,仅对最后N个分区进行积极压缩。其最终效果是将大部分最近的数据转换为更有可能被查询的优化列格式。尽管如此,出于不阻塞摄入操作的明显原因,您可能还希望异步运行压缩。如果您正在使用Delta Streamer,则可以在连续模式下运行,其中摄入和压缩都在单个Spark运行时并行管理。
原创
发布博客 2024.04.11 ·
360 阅读 ·
6 点赞 ·
0 评论 ·
0 收藏

Hudi 清理器的是怎么工作的?

Hudi清理器的是怎么工作的?
原创
发布博客 2024.04.11 ·
321 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink作业 taskmanager.numberOfTaskSlots 这个参数有哪几种设置方式

可以在Flink的配置文件 flink-conf.yaml 中直接设置 taskmanager.numberOfTaskSlots 参数的值。这样设置可以全局生效,适用于所有作业。来动态设置任务槽数量。这种方式适用于 flink on k8s,可以覆盖配置文件中的设置,针对特定作业进行调整。参数用于设置每个TaskManager上的任务槽(task slot)数量,决定了TaskManager可以并行执行的任务数量。这个参数可以通过多种方式进行设置。:在提交Flink作业时,可以通过命令行参数。
原创
发布博客 2024.04.09 ·
1213 阅读 ·
4 点赞 ·
1 评论 ·
1 收藏

Flink SQL 报错 Illegal use of ‘NULL‘

在Flink SQL中,使用 NULL 值会导致SQL验证失败,为了解决这个问题,可以使用 CAST(NULL AS STRING) 来代替直接使用 NULL。通过使用 CAST(NULL AS STRING) ,可以明确地将 NULL 值转换为字符串类型,以便在后续的字符串操作中正确处理空值情况。提示:Flink SQL 提交时不能带有分号。
原创
发布博客 2024.04.09 ·
1193 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏
加载更多