Apache Spark
片刻小哥哥
世界很美 而你正好有空
展开
-
2017-04-12 Spark MLlib 翻译计划开始组织成员
群号:214293307原创 2017-04-14 00:13:52 · 702 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark 编程指南 | ApacheCN
Spark 编程指南概述Spark 依赖初始化 Spark使用 Shell弹性分布式数据集 (RDDs)并行集合外部 Datasets(数据集)RDD 操作基础传递 Functions(函数)给 Spark理解闭包示例Local(本地)vs. cluster(集群)模式打印 RDD 的 elemen翻译 2017-09-21 16:19:14 · 1271 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark RDD(Resilient Distributed Datasets)论文 | ApacheCN
Spark RDD(Resilient Distributed Datasets)论文概要1: 介绍2: Resilient Distributed Datasets(RDDs)2.1 RDD 抽象2.2 Spark 编程接口2.2.1 例子 – 监控日志数据挖掘2.3 RDD 模型的优势2.4 不适合用 RDDs 的应用3翻译 2017-09-20 20:59:45 · 1227 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN
快速入门使用 Spark Shell 进行交互式分析基础Dataset 上的更多操作缓存独立的应用快速跳转本教程提供了如何使用 Spark 的快速入门介绍。首先通过运行 Spark 交互式的 shell(在 Python 或 Scala 中)来介绍 API, 然后展示如何使用 Java , Scala 和 Python 来编写应用程序。为翻译 2017-09-20 13:29:47 · 495 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 概述 | ApacheCN
Spark 概述Apache Spark 是一个快速的, 多用途的集群计算系统。 它提供了 Java, Scala, Python 和 R 的高级 API,以及一个支持通用的执行图计算的优化过的引擎. 它还支持一组丰富的高级工具, 包括使用 SQL 处理结构化数据处理的 Spark SQL, 用于机器学习的 MLlib, 用于图形处理的 GraphX, 以及 Spark Strea翻译 2017-09-20 13:23:08 · 425 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN
Submitting Applications在 script in Spark的 bin 目录中的spark-submit 脚本用与在集群上启动应用程序。它可以通过一个统一的接口使用所有 Spark 支持的 cluster managers,所以您不需要专门的为每个cluster managers配置您的应用程序。打包应用依赖如果您的代码依赖了其它的项目,为了分发翻译 2017-09-27 17:30:15 · 619 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - 集群模式概述 | ApacheCN
集群模式概述该文档给出了 Spark 如何在集群上运行、使之更容易来理解所涉及到的组件的简短概述。通过阅读 应用提交指南 来学习关于在集群上启动应用。组件Spark 应用在集群上作为独立的进程组来运行,在您的 main 程序中通过 SparkContext 来协调(称之为 driver 程序)。具体的说,为了运行在集群上,SparkContext 可以连接至几种类型翻译 2017-09-27 17:32:15 · 676 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
SparkR (R on Spark)概述SparkDataFrame启动: SparkSession从 RStudio 来启动创建 SparkDataFrames从本地的 data frames 来创建 SparkDataFrames从 Data Sources(数据源)创建 SparkDataFrame从 Hive tables翻译 2017-09-26 12:40:25 · 1254 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - GraphX Programming Guide | ApacheCN
GraphX Programming Guide概述入门属性 Graph示例属性 GraphGraph 运算符运算符的汇总表Property 运算符Structural 运算符Join 运算符邻域聚合聚合消息 (aggregateMessages)Map Reduce Triplets Transition G翻译 2017-09-26 12:33:19 · 519 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames and Datasets Guide | ApacheCN
Spark SQL, DataFrames and Datasets GuideOverviewSQLDatasets and DataFrames开始入门起始点: SparkSession创建 DataFrames无类型的Dataset操作 (aka DataFrame 操作)Running SQL Queries Progra翻译 2017-09-25 10:57:09 · 851 阅读 · 0 评论 -
Spark 2.0.2 中文文档 | 片刻 ApacheCN(Apache中文网)
ApacheCN(Apache中文网)- 关于我们 : http://www.apache.wiki/pages/viewpage.action?pageId=2887249ApacheCN(Apache中文网)- Apache Spark 2.0.2 中文文档 : http://www.apache.wiki/pages/viewpage.action?pageId=288361原创 2017-04-14 00:19:17 · 741 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档
Apache Spark™ 是一个快速的, 用于海量数据处理的通用引擎.官方网址: http://spark.apache.org中文文档: http://spark.apachecn.org花了大概两周左右的时间,在原来 Spark 2.0.2 中文文档 版本的基础上,终于迭代出该 Spark 2.2.0 中文文档 的版本了。衷心感谢每一位参与者,感谢 ApacheC原创 2017-07-17 16:18:52 · 1479 阅读 · 0 评论 -
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingContextDiscretized Streams (DStreams)(离散化流)Input DStreams 和 Receivers(接收器)DStreams 上的 Transformations(转换)DStreams 上的输出操作翻译 2017-09-21 16:30:39 · 896 阅读 · 0 评论