Spark
那伊抹微笑
世界上最遥远的距离不是天涯也不是海角而是妳站在饿的面前饿却不可以牵妳的手
展开
-
Apache Spark 2.0.2 中文文档 | 那伊抹微笑 - ApacheCN(Apache中文网)
ApacheCN(Apache中文网)- 关于我们 : http://www.apache.wiki/pages/viewpage.action?pageId=2887249ApacheCN(Apache中文网)- Apache Spark 2.0.2 中文文档 : http://www.apache.wiki/pages/viewpage.action?pageId=2883613原创 2016-11-08 10:23:16 · 12424 阅读 · 9 评论 -
Apache Spark 2.2.0 官方文档中文版(翻译完成 98%. 除 MLib 外) | ApacheCN
原文链接: http://www.apachecn.org/bigdata/spark/268.htmlApache Spark™ 是一个快速的, 用于海量数据处理的通用引擎.官方网址: http://spark.apache.org中文文档: http://spark.apachecn.org花了大概两周左右的时间,在原来 Spark 2.0.2 中文文档 版本的基础原创 2017-08-07 19:48:55 · 40252 阅读 · 13 评论 -
Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习的 MLlib, 用于图形处理的 GraphX, 以及 Spark Strea翻译 2017-09-20 13:42:29 · 671 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN
快速入门使用 Spark Shell 进行交互式分析基础Dataset 上的更多操作缓存独立的应用快速跳转本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来介绍 API, 然后展示如何使用 Java , Scala 和 Python 来编写应用程序。翻译 2017-09-20 14:01:08 · 489 阅读 · 0 评论 -
Apache Spark RDD 论文(中文翻译)
概要为了能解决程序员能在大规模的集群中以一种容错的方式进行内存计算这个问题,我们提出了 RDDs 的概念。当前的很多框架对迭代式算法场景与交互性数据挖掘场景的处理性能非常差,这个是 RDDs 的提出的动机。如果能将数据保存在内存中,将会使的上面两种场景的性能提高一个数量级。为了能达到高效的容错,RDDs 提供了一种受限制的共享内存的方式,这种方式是基于粗粒度的转换共享状态而非细粒度的更新共享状...翻译 2019-04-07 22:28:28 · 4574 阅读 · 7 评论