Spark快速大数据分析之第二章Spark 下载与入门

本文介绍了如何在Ubuntu系统上进行Spark的下载与安装,包括JDK的准备,从Apache官网获取预编译版Spark,以及设置日志级别。接着展示了通过ipython_notebook和python打开Spark的方式,并解释了Spark的基础概念——RDD。最后,通过一个简单的单词统计应用,阐述了Spark程序执行的基本架构,涉及驱动器和执行器的角色。
摘要由CSDN通过智能技术生成

2.1Spark下载与安装

JDK的安装

JDK的版本最好是1.8以上,使用的是ubuntu系统

安装源
        

sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update

安装jdk
sudo apt-get install oracle-java8-installer
sudo update-java-alternatives -s java-8-oracle

测试

java -version
javac -version


    注:JDK的默认安装目录为:JAVA_HOME="/usr/lib/jvm/java-8-oracle"

Spark的安装

spark的下载网址是:http://spark.apache.org/downloads.html

选择需要的版本下载,最好下载预编译版(prebuilt)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值