自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 partitionBy()的解释

partitionBy() 是 Spark RDD 的一个方法,用于对 RDD 进行重新分区。其主要作用是将 RDD 中的数据按照指定的分区方式进行重新分区,并返回一个新的分区后的 RDD。在 Spark 中,默认情况下使用哈希分区(Hash Partitioning)对 RDD 进行分区。但有时候我们需要自定义分区方式来更好地满足业务需求。这时候,我们可以使用 partitionBy() 方法来进行自定义分区。

2023-03-16 11:03:52 1264

原创 hadoop 运行jar包

我们在eclipse 打包好jar包后需要上传到udantu系统。我们用Xshell 工具上传,步骤如下图所示:这时候jar包已经上传成功了,在udantu查看jar包的位置现在就可以运行jar包了,命令如下:

2022-11-16 18:11:10 3641

原创 hadoop基础:通过 Shell 命令访问 HDFS

HDFS Shell 是由一系列类似 Linux Shell 的命令组成的。命令大致可分为操作命令、管理命令、其他命令三类。

2022-10-24 15:28:25 4320 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除