![](https://img-blog.csdnimg.cn/20190918140158853.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
数据分析
北海屿鹿
越努力,越幸运
展开
-
介绍 Apache Spark 的基本概念和在大数据分析中的应用
它支持批处理、流处理、机器学习和图计算等多种场景,并且提供了丰富的API和库来简化大数据处理的复杂性。:RDD是Spark的核心数据结构,它是一个可并行操作的、可变的、容错的分布式集合。它支持常见的流处理操作,如窗口计算、累加器、状态管理等,可以用于实时监控、实时报警等场景。:Spark提供了丰富的转换操作,如map、filter、reduce等,用于对RDD进行转换和操作。Spark的设计目标是为了提高大数据处理的速度和灵活性。它提供了丰富的转换和行动操作,可以方便地进行数据清洗、聚合、过滤等操作。原创 2024-03-06 10:46:04 · 304 阅读 · 0 评论 -
【jupyter notebook】
运行本单元,在其下插入新单元。:单元转入markdown状态。: 运行本单元,选中下个单元。: 中断Notebook内核。: 重启Notebook内核。: 恢复删除的最后一个单元。: 单元转入raw状态。: 单元转入代码状态。: 设定 1 级标题。: 设定 2 级标题。: 设定 3 级标题。: 设定 4 级标题。: 设定 5 级标题。: 设定 6 级标题。: 扩大选中上方单元。: 扩大选中下方单元。: 在上方插入新单元。: 在下方插入新单元。...原创 2022-09-01 08:55:07 · 288 阅读 · 0 评论