count操作中:把执行count操作的rdd中所有的partition的数据的总和时行相加,得到一个Long类型的返回值的操作.也就是说这个操作得到一个Long值,这个值当前的这个RDD中每个partition的iterator的总记录条数和.
task的function的定义部分:
这里主要是通过对每个partition中的iterator时行迭代,得到这个iterator的总记录数.
这里的Utils.getIteratorSize
count操作中:把执行count操作的rdd中所有的partition的数据的总和时行相加,得到一个Long类型的返回值的操作.也就是说这个操作得到一个Long值,这个值当前的这个RDD中每个partition的iterator的总记录条数和.
task的function的定义部分:
这里主要是通过对每个partition中的iterator时行迭代,得到这个iterator的总记录数.
这里的Utils.getIteratorSize