1.运行环境 ubuntu18.04 虚拟机,两台,一个master节点,两个slave节点。 python 3.6.9 spark 2.4.6 pycharm 20.1.4 2.实现方法 之前搜索的方法基本都是林子雨老师二次排序的代码,此次使用更简便的方法。 rdd = rdd1.sortBy(lambda x:x) 利用此代码就可以实现二次排序的效果,但要根据题目,适当修改,使x为可排序的项。