Spark 安装

Spark:Lightning-fast cluster computing。

    快如闪电的集群计算。
    大规模快速通用的计算引擎。
    速度:    比hadoop 100x,磁盘计算快10x
    使用:    java / Scala /R /python
            提供80+算子(操作符),容易构建并行应用。
    通用:    组合SQL ,流计算 + 复杂分析。

    运行:    Hadoop, Mesos, standalone, or in the cloud,local.

Spark模块
    Spark core              //核心模块
    Spark SQL              //SQL
    Spark Streaming     //流计算
    Spark MLlib             //机器学习
    Spark graph             //图计算

    DAG                         //direct acycle graph,有向无环图。

安装Spark

1.下载spark-2.1.0-bin-hadoop2.7.tgz
        下载地址:http://spark.apache.org/downloads.html
    2.解压
    3.环境变量
        [/etc/profile]
        SPARK_HOME=/soft/spark
        PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin        
        [source]
        $>source /etc/profile

    4.验证spark        
        $>cd /soft/spark
        $>./spark-shell

    5.webui
        http://s201:4040/
 

SparkContext,Spark程序的入口点,封装了整个spark运行环境的信息。

进入spark-shell
        $>spark-shell
        $scala>sc

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值