电信中心
码龄8年
关注
提问 私信
  • 博客:44,566
    44,566
    总访问量
  • 29
    原创
  • 32,260
    排名
  • 192
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2017-05-04
博客简介:

PAIN的博客

博客描述:
超级菜鸡
查看详细资料
  • 原力等级
    成就
    当前等级
    1
    当前总分
    98
    当月
    0
个人成就
  • 获得265次点赞
  • 内容获得11次评论
  • 获得288次收藏
  • 代码片获得134次分享
创作历程
  • 12篇
    2024年
  • 9篇
    2023年
  • 3篇
    2022年
  • 3篇
    2018年
  • 2篇
    2017年
成就勋章
TA的专栏
  • Spark
  • 过去的U3D,OpenCV,C++
    8篇
  • SQL
    1篇
  • Kafka
    2篇
  • Flink
    1篇
  • Hive
    2篇
  • Hadoop
    1篇
  • 设计模式
  • Java
    1篇
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

344人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Iceberg 写入时优化

MERGE INTO。
原创
发布博客 2024.11.10 ·
882 阅读 ·
24 点赞 ·
0 评论 ·
7 收藏

Iceberg 写入和更新模式,COW,MOR(Copy-on-Write,Merge-on-Read)

Copy-On-Write 模式在 v1 表或者 v2 表都可以使用。
原创
发布博客 2024.11.10 ·
528 阅读 ·
3 点赞 ·
0 评论 ·
8 收藏

Spark Join优化案例:Join Key 远大于 Payload

要知道,我们要构建的,是以小时为单位的时序序列,但由于流量的切割粒度非常细致,因此有些种类的流量不是每个小时都有访问量的,如下图所示。生成的方法分两步:把所有 Join Keys 拼接在一起,把性别、年龄、一直到小时拼接成一个字符串,如图中步骤 1、3 所示使用哈希算法(如 MD5 或 SHA256)对拼接后的字符串做哈希运算,得到哈希值即为“Hash Key”,如上图步骤 2、4 所示在两张表上,我们都进行这样的操作。然后,我们以同样的维度组合统计日志中的访问量,就可以得到图中右侧的“正样本表”。
原创
发布博客 2024.06.30 ·
903 阅读 ·
14 点赞 ·
0 评论 ·
15 收藏

Spark Cache 的用武之地

如果 RDD/DataFrame/Dataset 在应用中的引用次数为 1,我们就坚决不使用 Cache如果引用次数大于 1,且运行成本占比超过 30%,我们就考虑启用 Cache(其中,运行成本占比的计算,可以利用 Spark 3.0 推出的 noop 功能)Action 算子要选择 count 才能完全物化缓存数据,以及在调用 Cache 的时候,我们要把待缓存数据赋值给一个变量。这样一来,只要是在这个变量之上的分析操作都会完全复用缓存数据。
原创
发布博客 2024.06.30 ·
976 阅读 ·
17 点赞 ·
0 评论 ·
19 收藏

LeetCode每日一题 2734.子串操作后的字典序最小字符串|标志位遍历字符数组

希望这篇博客能够帮助你理解如何通过标志位和中断操作来高效地解决这个问题,进一步掌握字符串的操作技巧。欢迎在评论区分享你的看法和疑问!通过这种方法,我们能够高效地解决问题,并确保字符串在经过最少的操作后,字典序最小。#字符串操作 #字典序 #算法 #LeetCode解题 #Scala #编程技巧。目标是通过最少的操作使得字符串变得字典序最小。
原创
发布博客 2024.06.28 ·
451 阅读 ·
5 点赞 ·
0 评论 ·
6 收藏

LeetCode 每日一题 2748. 美丽下标对的数目

题目要求我们给定一个整数数组nums,找出所有满足特定条件的下标对。这里的特定条件是:如果nums[i]的第一个数字和nums[j]的最后一个数字互质,那么我们称这对下标为“美丽下标对”。🌟。
原创
发布博客 2024.06.19 ·
816 阅读 ·
4 点赞 ·
0 评论 ·
8 收藏

LeetCode每日一题 | 419 | 甲板上的战舰 |二维数组遍历

✨今天给大家带来的是LeetCode上的第419题——甲板上的战舰(✨。这道题目是一个经典的二维数组遍历问题,要求我们在一个棋盘中找到所有的战舰。接下来给大家详细讲解一下解题思路和主要的数据结构哦~🥳。
原创
发布博客 2024.06.11 ·
428 阅读 ·
5 点赞 ·
0 评论 ·
6 收藏

LeetCode每日一题 | 2938.区分黑球与白球 | 数组逆序+计数器

这道题其实是一个思路非常清晰的题目,通过逆序遍历和计数器的巧妙使用,我们可以在一次遍历中完成所有计算。希望大家看完后能有所收获,继续加油刷题吧!💪💻我们下期再见~👋记得关注我获取更多LeetCode题解和编程技巧哦!🌟。
原创
发布博客 2024.06.06 ·
472 阅读 ·
3 点赞 ·
0 评论 ·
5 收藏

LeetCode每日一题:将元素分配到两个数组中 II - 二叉索引树BIT

通过使用二叉索引树(BIT),我们成功地解决了这一复杂的分配问题,保证了分配的高效性和准确性。希望这个方法能帮助到大家!如果有任何问题或者建议,欢迎在评论区留言。💬#LeetCode #算法 #数据结构 #二叉索引树 #BIT #数组分配发布时间:2024-06-05。
原创
发布博客 2024.06.05 ·
935 阅读 ·
16 点赞 ·
0 评论 ·
5 收藏

【LeetCode每日一题】3067. 在带权树网络中统计可连接服务器对数目-DFS和图

Hey我的编程小伙伴们👋,今天我要和大家分享一道我在LeetCode上遇到的超有趣的题目——编号3067的“在带权树网络中统计可连接服务器对数目”。这是一道非常适合练习DFS和图的题目哦!🤓💻。
原创
发布博客 2024.06.04 ·
1147 阅读 ·
10 点赞 ·
0 评论 ·
5 收藏

LeetCode每日一题:分糖果II | 数组+简单模拟

在这个问题中,我们需要将指定数量的糖果分配给一队人,每个人按顺序接收糖果,每轮分配的糖果数量依次递增,直到所有糖果分完。。
原创
发布博客 2024.06.03 ·
376 阅读 ·
8 点赞 ·
0 评论 ·
2 收藏

LeetCode 每日一题:分糖果 太简单,一分钟一行秒了!

今天和大家分享一道 LeetCode 上的有趣题目——分糖果 🍭. - 力扣(LeetCode)。题目要求只能吃一半糖果的情况下,尽可能多地让Alice吃到不同种类的糖果。
原创
发布博客 2024.06.02 ·
252 阅读 ·
4 点赞 ·
0 评论 ·
4 收藏

Flink面试题(施工中)

可以使用自定义触发器,解决事件时间,没有数据到达,窗口不触发计算问题,还可以使用持续性触发器,实现一个窗口多次触发输出结果,详细看连接。窗口的创建:当属于某个窗口的第一个元素到达,Flink就会创建一个窗口,并且放入单例集合。窗口什么时候触发:如基于事件时间的窗口 watermark >= end - 1ms。(Flink保证只删除基于时间的窗口,而不能删除其他类型的窗口,例如全局窗口)。窗口的销毁:时间进展 >= 窗口最大时间戳 + 窗口允许延迟时间。窗口的划分:如,基于事件时间的滚动窗口。
原创
发布博客 2023.08.10 ·
199 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Kafka 系统的 CAP 保证(HW,Leader-Epoch)

为了解决 HW 更新时机是异步延迟的,Kafka 引入了 leader epoch 机制;在每个副本日志目录下都创建一个 leader-epoch-checkpoint 文件,用于保存 leader 的 epoch 信息,。它的格式为 (epoch offset),epoch 指的是 leader 版本,它是一个单调递增的一个正整数值,每次 leader变更,epoch 版本都会 +1,offset 是每一代 leader 写入的第一条消息的位移值,比如:(0,0)(1,300)
原创
发布博客 2023.08.09 ·
614 阅读 ·
1 点赞 ·
1 评论 ·
3 收藏

Kafka 面试题 (施工中)

详情见:
原创
发布博客 2023.08.09 ·
143 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Hive基础知识点

重点集合类型:row format delimited fields terminated by ‘,’ 字段分隔符collection items terminated by ‘_’ 集合元素分隔符map keys terminated by ‘:’ map的kv分隔符行分隔符。
原创
发布博客 2023.07.29 ·
137 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

解决Hive表的中文注释乱码

把 character_set_server=utf8 加入/etc/my.cnf 的 [mysqld] 下方 ,systemctl restart mysqld 重启mysql。之前创建过的表的注释乱码改不回来了,只能删了重建表喽。进入mysql下的metastore库执行。重启hive的相关进程即可。
原创
发布博客 2023.07.28 ·
84 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Hadoop配置参数优化

(1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。(2)需求分析:1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster平均每个节点运行10个 / 3台 ≈ 3个任务(4 3 3)
原创
发布博客 2023.07.21 ·
464 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

【设计模式】简化冗长的ifelse

如何简化冗长的ifelse?
原创
发布博客 2023.07.08 ·
34 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

JavaSE考试题库基础题123题

JavaSE考试题123道
原创
发布博客 2023.06.24 ·
2437 阅读 ·
1 点赞 ·
1 评论 ·
3 收藏
加载更多