spark的问题

1.hdfs中没有spark文件夹以及a.txt文件
[root@hdp-1 bin]# hadoop fs -mkdir /spark
[root@hdp-1 bin]# hadoop fs -touchz /spark/a.txt
[root@hdp-1 bin]# echo “hello you hello me” | hadoop fs -appendToFile - /spark/a.txt
[root@hdp-1 bin]# hadoop fs -cat /spark/a.txt
hello you hello me
2.sc.textFile("/spark/hi.txt")找不到hdfs上的文件的问题
sc.textFile(“hdfs://hdp-1:9000/spark/a.txt”).flatMap(.split(",")).map((,1)).reduceByKey(+).saveAsTextFile(“hdfs://hdp-1:9000/spark/out”)
3.配置文件

yarn.nodemanager.vmem-check-enabled
false
Whether virtual memory limits will be enforced for containers


yarn.nodemanager.vmem-pmem-ratio
4
Ratio between virtual memory to physical memory when setting memory limits for containers

4.线程“main”中的异常java.lang.Exception:当使用master“yarn”运行时,必须在环境中设置HADOOP_CONF_DIR或YARN_CONF_DIR.

解决办法:使用Yarn运行spark时,需要在spark-env.sh中添加以下行
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
5.new SparkConf错误原因是pom里hadoop和spark的版本
6.package是失败,报target/clases不存在是因为工程路径中有中文
7.报数组越界的错就是因为少了一台spark的worker,但这具体只因为什么还不清楚

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值