- 问题
在执行spark任务中,发现sortByKey()算子会触发一个新的job
但在spark中,sortByKey()算子归属于Transformations列表中,而只有当算子是action的时候,才会触发新的job,那么sortByKey()为何会触发新的任务呢?让我们去看看sortByKey()的算子源码。。。。
原因很明确了,因为在sortByKey()算子中,会调用collect或者save方法,从而导致sortByKey()会触发新的任务
在执行spark任务中,发现sortByKey()算子会触发一个新的job
但在spark中,sortByKey()算子归属于Transformations列表中,而只有当算子是action的时候,才会触发新的job,那么sortByKey()为何会触发新的任务呢?让我们去看看sortByKey()的算子源码。。。。
原因很明确了,因为在sortByKey()算子中,会调用collect或者save方法,从而导致sortByKey()会触发新的任务