1、Spark预编译版本下载安装与启动

1、下载
预编译 spark-2.2.0-bin-hadoop2.7.tgz 源码编译 略

2、安装 解压 tar -xzvf spark-2.2.0-bin-hadoop2.7.tgz 移动 mv spark-2.2.0-bin-hadoop2.7 /usr/soft/ 配置环境变量 export SPARK_HOME=/usr/soft/spark-2.2.0-bin-hadoop2.7 export PATH=$PATH:$SPARK_HOME/bin 运行 spark-shell spark-shell local[4] spark-shell --master local[4]

3、hadoop maxtemp wordCount

4、spark-shell sc: SparkContext

scala> val file = sc.textFile("/root/aa.txt")
    file: org.apache.spark.rdd.RDD[String] = /root/aa.txt MapPartitionsRDD[1] at textFile at <console>:24

scala> file.count()
    res0: Long = 11

scala> file.first() res1: String = hello dkfdf

5、Resilient Distributed Dataset 弹性分布式数据集,自动重构取得恢复丢失的分区数据

6、通过编译方式安装spark 下载源码 解压 使用maven编译源码

轻量级高速集群计算。 针对大规模的数据处理快速通用的引擎。 比hadoop的MR的内存计算快100倍,磁盘10倍 易于使用,可以使用java,scala,python,R语言

提供了80多个高级操作

转载于:https://my.oschina.net/u/164027/blog/1556588

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值