个人感觉不错的文章链接:https://www.cnblogs.com/MOBIN/p/5414490.html
本发所讲函数
1.reduce(func):通过函数func先聚集各分区的数据集,再聚集分区之间的数据,func接收两个参数,返回一个新值,新值再做为参数继续传递给函数func,直到最后一个元素
2.collect():以数据的形式返回数据集中的所有元素给Driver程序,为防止Driver程序内存溢出,一般要控制返回的数据集大小
6.top(n):按默认或者指定的排序规则返回前n个元素,默认按降序输出