安装Python最方便的方式是使用软件包来安装。安装Anaconda软件包时会同时安装很多软件包,包括IPython Notebook、NumPy、SciPy、Matplotlib。这几个使用与数据分析、科学计算上常用软件包。
IPython Notebook具备交互式界面,我们可以在Web界面输入Python命令后立刻看到结果。我们还可以将数据分析的过程和运行后的命令与结果存储成笔记本,下次打开笔记本,重新执行这些代码,IPython Notebook笔记本可以包含文字、数学公式、程序代码、结果、图形、视频。因为IPython Notebook是功能强大的交互式界面,很适合数据分析,所以在后续的章节中我们会使用IPython Notebook示范Spark的命令。
9.1安装Anaconda
9.1.1复制Anaconda网址
https://repo.continuum.io/archive/index.html
这里我们选择的是Anacond2-2.5.0-Linux-x86_64.sh,因为此版本与Spark2.0兼容。
9.1.2下载Anacond2-2.5.0-Linux-x86_64.sh
wget https://repo.continuum.io/archive/Anaconda2-2.5.0-Linux-x86_64.sh
9.1.3安装Anaconda
bash Anaconda2-2