提交spark的时候报错解决方法:
1,首先pyspark尝试import numpy.发现报错:“No module named numpy”
2, 上面的错误表示当下的python没有安装numpy,安装即可。
3,一般情况下不需要安装的,该机器下应该有多个版本的python.whereis python找到各个版本的python,依次查看是否安装了numpy.
4,找到安装numpy的python版本后,修改PATH。PATH=/usr/bin/:$PATH.这里面的“/usr/bin/”即是步骤3中找到的python路径。下面重新提交即可