先对各个分区的迭代器计数,然后sum
/**
* Return the number of elements in the RDD.
*/
/**
* TODO: 可以看出 是对每个分区计算 计算这个分区后直接将这个分区的结果
* 发送到Driver端,在driver端在对分区的结果进行就算 汇总
* @return
*/
def count(): Long = sc.runJob(this, Utils.getIteratorSize _).sum