自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_53384960的博客

原创 kafka：查看topic与application列表

yarn application -kill 查看yarn下的application列表。查看kafka下的topic列表。查看指定topic的详细信息。删除application。

2023-12-06 16:37:37 102 1

原创 Flink

WaterMark包含一个时间戳，Flink使用WaterMark保证所有小于该时间戳的消息都已流入，Flink的数据源在确认所有小于该时间戳的消息都已流入，Flink的数据源在确认所有小于某个时间戳的消息都已输出到Flink流处理器后，会生成一个包含该时间戳的WaterMark，插入到消息流中输出到Flink流处理系统中；一旦一个watermark到达了operator，operator可以将内部事件时间提前到watermark的时间戳。（前移的太多就会导致整体任务延时较大）Flink（流式处理）

2023-12-01 20:36:45 53 1

原创 spark基础知识

广播大变量：:Executor一开始并没有广播变量，而是task运行需要用到广播变量，会找executor的blockManager要，bloackManager找Driver里面的 blockManagerMaster要。优化数据结构：对象、字符串、集合类型（HashMAP、LinkList）会占用大量内存，尽量使用原始类型（int、Long）代替字符串，或者数组代替集合类型，减少内存小占用，降低GC。（RDD存储共有12种，大致分为1、内存 2、磁盘 3、序列化 4、副本 5、本地内存）

2023-11-17 21:07:25 44

原创 Spark相关进阶知识点

Driver 中的 SparkContext 分配 Task 给 Executor 执行，Executor 运行 Task 并向 Driver 汇报运行的状态、进度、以及最终的计算结果；AM的功能相当于一个 ExecutorLaucher （Executor启动器），负责向 RM申请 Container 资源，RM收到请求后便会与 NM通信，启动 Container。Executor进程启动后会向 Driver 反向注册，Executor 全部注册完成后 Driver 开始执行执行 Job 任务。

2023-11-12 21:34:46 65

原创数据仓库架构

经历ODS的数据清洗加工、维度退化、数据探查得到的数据，会做一部分数据聚合操作，提高数据的可用性。对通用的核心维度进行轻度的聚合操作。DWS：数据服务层（宽表）

2023-10-24 20:20:52 23

原创 node节点没有datanode

4、应该是数据格式化太多次，导致数据冲突，将node中的data文件删除：rm -rf data/2、查看node日志：cat hadoop-root-datanode-node1.log。5、然后咋master中格式化：hdfs namenode -format。1、关闭hadoop：start-all.sh。3、查看错误信息：若出现如下信息。

2023-09-21 10:32:50 172

原创 Hadoop学习笔记1

多样化：是指数据的类型多样化处理的数据通常包括：日志数据，JSON数据（半结构化数据），结构化数据（二维结构数据）通常来自于业务系统中。Hadoop是一个适合海量数据的分布式存储（HDFS）和分布式计算（MapReduce）的平台（分而治之）Yarn：资源调度平台，负责给计算框架分配计算资源（在hadoop1.x后产生）真实：只要是历史产生过的数据，那么就可以存放到大数据库中，用于做数据分析。高速：数据产生的速度较快，其数据产生的速度，是单台机器无法承载的。价值：数据中可以挖掘的价值。

2023-09-20 14:15:31 34 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

qq_53384960 CSDN认证博客专家 CSDN认证企业博客

码龄4年

IP 属地：安徽省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

188万+: 周排名

26万+: 总排名

493: 访问

: 等级

70: 积分

0: 粉丝

0: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

最新评论

kafka：查看topic与application列表
CSDN-Ada助手: 恭喜您发布了第7篇博客！看到您对kafka的研究和分享，我感到非常兴奋。希望您能继续分享更多关于kafka的知识，比如如何优化topic与application的管理，或者深入探讨kafka在实际应用中的一些技巧和经验。期待您的下一篇作品！
Flink
CSDN-Ada助手: 恭喜你写了第6篇博客！Flink相关知识点确实是一个很有深度的话题，你的文章讲解得很清楚，让人受益匪浅。接下来，如果可能的话，可以考虑结合实际案例或者应用场景来丰富你的内容，这样读者们会更加深入地理解和应用这些知识点。期待你的下一篇作品！
Spark相关进阶知识点
CSDN-Ada助手: 恭喜作者撰写第四篇博客！标题“Spark相关进阶知识点”听起来非常吸引人。持续创作对于提升自己的技能和知识水平非常重要，而且您的博客内容一直都非常有价值。在下一篇博客中，我想建议您探索一些与Spark相关的实际案例，以帮助读者更好地理解和应用这些进阶知识点。再次感谢您的分享，期待您的下一篇精彩文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Hadoop学习笔记1
CSDN-Ada助手: 恭喜您开始了博客创作的第一步！标题为“Hadoop学习笔记1”引人入胜，让人期待接下来的内容。对于初次涉足Hadoop学习的读者来说，您的博客将会是一份宝贵的学习资料。在接下来的创作中，建议您可以结合您的学习经验，进一步深入讲解Hadoop的核心概念和关键技术，同时以实例进行说明，这样读者更容易理解和掌握。再次祝贺您，期待您的博客越来越精彩！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除