目录 写在前面的话 需要的前瞻知识 用到的软件版本 数据集 代码原理 部分代码 Task2函数的代码(主要部分) 主函数代码 运行spark 导包 一些Spark信息的和schema的导入 如果spark链接报错 运行结果 总纲