spark复习

最新推荐文章于 2024-07-28 16:45:11 发布

想守护令人心疼的美好

最新推荐文章于 2024-07-28 16:45:11 发布

阅读量103

点赞数

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43661545/article/details/110353919

版权

spark重要特点：中间结果可以保存在内存中（内存计算）
spark是基于内存的
速度比基于硬盘（HDFS）的MapReduce更快
spark生态系统（BDAS）
伯克利数据分析栈（BDAS）
Spark Core
提供spark核心功能，实现了spark的底层机制并提供基本数据抽象格式
Spark SQL
提供Spark SQL语言的解析和执行
Spark Streaming
流式计算框架，提供了数据流的接入，抽象，计算等规范
MLlib
机器学习框架，常用机器学习算法的分布式实现
GraphX 分布式图计算框架，常用图算法的分布式实现
Tachyon 分布式文件存储系统

Scala
由java开发，基于JVM运行，计算速度快（比python快近10倍），可无缝调用java API，完美兼容HAdoop生态组件（由java开发）类型系统较复杂，语法简洁，支持函数式编程

多范式编程语言，多范式特性，集成了面向对象编程和函数式编程在这里插入图片描述
函数式编程（FP）
是一种使用函数编程的编程范式
建立在函数的Lambda演算的基础之上
Lambda演算
函数可视为一种数据类型
函数的参数和返回值均可为函数类型
即函数可以参数形式传入另一个函数也可以返回值形式作为一个函数的运算结果

特点：
在这里插入图片描述

想守护令人心疼的美好

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark复习

spark重要特点：中间结果可以保存在内存中（内存计算）spark是基于内存的速度比基于硬盘（HDFS）的MapReduce更快spark生态系统（BDAS）伯克利数据分析栈（BDAS）Spark Core提供spark核心功能，实现了spark的底层机制并提供基本数据抽象格式Spark SQL提供Spark SQL语言的解析和执行Spark Streaming流式计算框架，提供了数据流的接入，抽象，计算等规范MLlib机器学习框架，常用机器学习算法的分布式实现GraphX 分布式
复制链接

扫一扫

想守护令人心疼的美好 CSDN认证博客专家 CSDN认证企业博客

码龄6年

26: 原创

58万+: 周排名

218万+: 总排名

1万+: 访问

: 等级

291: 积分

4: 粉丝

1: 获赞

2: 评论

21: 收藏

私信

关注

热门文章

最新评论

酒店评论情感分析终
ctotalk: 好好学习，天天向上.
数据集的划分及交叉验证
想守护令人心疼的美好: 有些新收获关于k折验证中如果数据集不够大选择不同的验证集可能对结果产生很大影响所以我们用k折交叉验证，既可以调整超参数通过平均的结果能更好的的评估算法以及每次划分训练集和验证集不同训练出的参数也不同可以通过交叉验证中最好的结果得到最好的参数

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。