子雨大数据之Spark入门教程(Python版): http://dblab.xmu.edu.cn/blog/1709-2/
子雨大数据之Spark入门教程(Scala版): http://dblab.xmu.edu.cn/blog/spark/
https://blog.csdn.net/FlySky1991
PySpark pandas udf: https://www.imooc.com/article/269724
使用Pandas_UDF快速改造Pandas代码: https://www.cnblogs.com/wkang/p/10255043.html
在PySpark的并行跑xgboost模型: