单机搭建基于Hadoop的Spark环境

  Spark是运行在yarn(也就是hadoop,一般特指资源管理器)上的应用,前面的一篇文章中已经搭好了yarn+hdfs,接下来的配置就很简单了。

  1. 从官网下载spark-binary
  2. 解压后重命名conf/spark-env.sh.templateconf/spark-env.sh
  3. 配置:添加一行类似于这样的HADOOP_CONF_DIR=~/tools/hadoop-2.6.2/etc/hadoop
  4. 以yarn-cluster模式提交一个测试任务(spark自带有一些例子,就不需要自己写了)
bin/spark-submit \
  --class org.apache.spark.examples.SparkPi \
  --master yarn-cluster  \
  --num-executors 1 \
  lib/spark-examples*.jar \
  10

更新 - 2015-12-19

yarn-cluster模式不能直接看到结果,但是用yarn-client又会出错。从错误信息来看是(虚拟)内存超了,这个时候把driver内存设大一点即可。

bin/spark-submit \
  --class org.apache.spark.examples.SparkPi \
  --master yarn-client  \
  --num-executors 1 \
  --driver-memory 1g \
  lib/spark-examples*.jar \
  10

更新 - 2016-01-01

开启snappy压缩
重命名conf/spark-env.sh.templateconf/spark-env.sh,追加内容

HADOOP_HOME=~/tools/hadoop
HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop/
SPARK_LIBRARY_PATH=$HADOOP_HOME/lib/native
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值