intro
首先,这里介绍的方法很基本,大牛可以绕过了。
由于个人的测试需要,打算在自己的pc上面安pyspark,来熟悉MLlib。
翻了一下bing和狗,方法不少,试了linux虚拟机安装,vmware 下cloudera的安装。走到后面都会发现,这些方法并不合适,或者对机器有要求,或者对安装者的背景有要求。
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
正文分隔行
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
这里主要是把原文的方法列一下,加上我碰到的一些问题。
1,安装Anaconda 和 GOW(Gnu on windows)
前者的安装我就不写了。地址是:https://repo.continuum.io/archive/
我的机器上面装的miniconda。
GOW的地址:https://github.com/bmatzelle/gow/releases/download/v0.8.0/Gow-0.8.0.exe
GOW的作用是在cmd下面执行linux 命令。安装结束之后可以运行:
gow --list
如果安装正确,可以返回
Available executables: awk, basename, bash, bc, bison, bunzip2, bzip2, bzip2recover, cat, chgrp, chmod, chown, chroot, cksum, clear, cp, csplit, curl, cut, dc,dd, df, diff, diff3, dirname, dos2unix, du, egre