全网最细~ Spark RDD 之五种属性 《大力仑出品之次品》 1 一系列分区,分区有编号,有顺序的 2 每一个切片都会有一个函数作业在上面用于对数据进行处理 3 RDD和RDD之间存在依赖关系 4 可选,key value类型的RDD才有RDD[(K,V)])如果是kv类型的RDD,会一个分区器,默认是hash-partitioned 5 可以,如果是从HDFS中读取数据,会得到数据的最优位置(向Namenode请求元数据)