- sortByKey()
- 格式: sortByKey(ascending=True|False 默认为True)
- 说明: 根据key进行排序操作, 默认按照key进行升序排序, 如果需要倒序 设置ascending为False
rdd = sc.parallelize([('c05','张三'),('c02','李四'),('c07','王五'),('c01','赵六'),('c03','田七'),('c08','周八'),('c04','李九')])
根据班级的序号进行排序操作
rdd.sortByKey().collect()
结果:
[('c01', '赵六'), ('c02', '李四'), ('c03', '田七'), ('c04', '李九'), ('c05', '张三'), ('c07', '王五'), ('c08', '周八')]
倒序排列:
rdd.sortByKey(ascending=False).collect()
结果:
[('c08', '周八'), ('c07', '王五'), ('c05', '张三'), ('c04', '李九'), ('c03', '田七'), ('c02', '李四'), ('c01', '赵六')]
rdd = sc.parallelize([('c2','张三'),('c11','李四'),('c21','王五'),('c3','赵六'),('c1','田七'),('c08','周八'),('c04','李九')])
rdd.sortByKey(ascending=False).collect()
结果: 字典序, 因为 key是字符串
[('c3', '赵六'), ('c21', '王五'), ('c2', '张三'), ('c11', '李四'), ('c1', '田七'), ('c08', '周八'), ('c04', '李九')]