![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
spark的一些操作
文章平均质量分 87
saprk中的静态数据,流数据的操作一些浅显的看法与笔记
俺会hello我的
加油吧,一切都会好起来的
展开
-
Spark Streaming的基本数据流
spark中的基本流数据类型原创 2023-11-23 09:57:15 · 212 阅读 · 0 评论 -
启动kafka集群以及关闭
按照这个顺序关闭 Kafka 集群可以最大程度地减少关闭过程中可能出现的问题,比如数据不一致或者服务无法正常回复。,以确保所有组件都可以优雅地关闭,避免数据丢失或损坏。这是一种实时监控 Kafka 主题消息的便捷方式。运行此命令后,控制台将开始显示从主题。:有时候一次没成功得是第二次第三次。原创 2023-11-22 14:04:50 · 457 阅读 · 0 评论 -
dataframe与saprkSQL的概念与操作
sparkSQL原创 2023-11-12 21:56:55 · 54 阅读 · 1 评论 -
Structured Streaming的模型介绍与实际操作
微批处理是 Structured Streaming 默认的处理模型。微批处理 (Micro-batching):优点:缺点:持续处理是 Structured Streaming 在 Spark 2.3 版本中引入的实验性功能。在这种模型中,实时数据流被视为连续的记录流,Spark 引擎以较低的延迟(毫秒级)持续处理每条记录。持续处理 (Continuous Processing):优点:缺点:这两种模型可以用以下表格进行比较:在选择模型时,需要根据具体的应用场景、延迟要求和资源情况来决定使用哪种模型。如果原创 2023-11-29 16:25:55 · 1110 阅读 · 0 评论 -
Structured Streaming: Apache Spark的流处理引擎
Structured Streaming简介原创 2023-11-29 16:17:48 · 872 阅读 · 0 评论