首先根据两个方法的名字,我们大概可以了解到:
两个方法的差异就在于有没有 key这个单词,所以说:groupBy()方法是根据用户自定义的情况进行分组,而groupByKey()则是根据key值进行分组的,也就是说,进行groupByKey()方法的数据本身就是一种key-value类型的,并且数据的分组方式就是根据这个key值相同的进行分组的
那么groupBy()分组的方法呢?就是工具groupBy()传入的方法返回的值进行分组
参考
首先根据两个方法的名字,我们大概可以了解到:
两个方法的差异就在于有没有 key这个单词,所以说:groupBy()方法是根据用户自定义的情况进行分组,而groupByKey()则是根据key值进行分组的,也就是说,进行groupByKey()方法的数据本身就是一种key-value类型的,并且数据的分组方式就是根据这个key值相同的进行分组的
那么groupBy()分组的方法呢?就是工具groupBy()传入的方法返回的值进行分组
参考