spark core 2.0 Partition and HadoopPartition

最新推荐文章于 2024-08-07 14:43:07 发布

houzhizhen

最新推荐文章于 2024-08-07 14:43:07 发布

阅读量485

点赞数 1

分类专栏： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/houzhizhen/article/details/55511440

版权

spark 专栏收录该内容

158 篇文章 2 订阅

订阅专栏

Spark Partition is a trait.

/**
 * An identifier for a partition in an RDD.
 */
trait Partition extends Serializable {
  /**
   * Get the partition's index within its parent RDD
   */
  def index: Int

  // A better default implementation of HashCode
  override def hashCode(): Int = index

  override def equals(other: Any): Boolean = super.equals(other)
}

/**
 * A Spark split class that wraps around a Hadoop InputSplit.
 */
private[spark] class HadoopPartition(rddId: Int, override val index: Int, s: InputSplit)
  extends Partition {

  val inputSplit = new SerializableWritable[InputSplit](s)

  override def hashCode(): Int = 31 * (31 + rddId) + index

  override def equals(other: Any): Boolean = super.equals(other)

  /**
   * Get any environment variables that should be added to the users environment when running pipes
   * @return a Map with the environment variables and corresponding values, it could be empty
   */
  def getPipeEnvVars(): Map[String, String] = {
    val envVars: Map[String, String] = if (inputSplit.value.isInstanceOf[FileSplit]) {
      val is: FileSplit = inputSplit.value.asInstanceOf[FileSplit]
      // map_input_file is deprecated in favor of mapreduce_map_input_file but set both
      // since it's not removed yet
      Map("map_input_file" -> is.getPath().toString(),
        "mapreduce_map_input_file" -> is.getPath().toString())
    } else {
      Map()
    }
    envVars
  }
}

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

houzhizhen CSDN认证博客专家 CSDN认证企业博客

码龄18年

633: 原创

2万+: 周排名

2657: 总排名

123万+: 访问

: 等级

1万+: 积分

848: 粉丝

1158: 获赞

73: 评论

1727: 收藏

私信

关注

热门文章

分类专栏

最新评论

Kubernetes 文档 / 概念 / 工作负载 / 工作负载管理 / StatefulSet
ha_lydms: 牛牛牛！太全面了，以后要用，忘记了直接来这里找表情包
Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配
全栈小5: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。【Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配，博主这篇文章，值得一看】
Kubernetes 文档 / 概念 / 服务、负载均衡和联网 / Service ClusterIP 分配
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Kubernetes 文档 / 概念 / Kubernetes 架构 / 关于 cgroup v2
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Kubernetes 文档 / 概念 / 概述 / Kubernetes 对象
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。