一、Spark 客户端操作API
Spark Shell 仅在测试和验证我们的程序时使用的较多,在生产环境中,通常会在 IDE 中编制程序,然后打成 jar 包,然后提交到集群,最常用的是创建一个 Maven 项目,利用 Maven 来管理 jar 包的依赖
1. 准备使用的IDE 是 IDEA ,所以把这个工具安装一下 ,安装过程不过多,也自行网上解决或者留言
这里说明下 eclipse和IDEA 的一个不同点 就是: eclipse 的 workspace 对应的是 IDEA的 project, eclipse 的 project对应的是 IDEA的 module
2. 创建Maven项目