Spark分区(key value类型) 1)默认采用Hash分区 缺点:可能导致每个分区中数据量的不均匀,极端情况下会导致某些分区拥有RDD的全部数据。 2)Ranger分区 要求RDD中的KEY类型必须可以排序。 3)自定义分区 根据需求,自定义分区。