一、Python和Java安装
由于我的电脑是已经安装好了Java–11.0.4,python–3.7的所以,这两个的安装我就直接跳过了,如果你电脑上没有安装这两个怎么办? 作为贴心小暖男的我,当然是为你们考虑的很周全了呀!Click这个神奇的超链接,你将看见完整的环境安装文档哟!没错,我的PySpark安装也是按照这个操作手册来做的!
二、Spark安装
2.1 下载文件
点击此处访问Apache官网,如果你点击了这个链接,那么你将看到如下截图:
而一般建议是版本选择2.1以上的,现在最新版本是3.0,下面的类型一般选择Hadoop2.7之后。如果这个两个选择的下拉框弹不出来的话,那么请点击 传送门 如果你是Windows系统,请直接按照如图下载,而这也是我最喜欢的简单粗暴的下载方式: