自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Hadoop中Text类型的长度

在Hadoop权威指南中,有一段代码用于检查Text类型变量的字节长度。 int firstL1=WritableUtils.decodeVIntSize(b1[s1])+readVInt(b1,s1); 根据其他博文知道Text类型变量用第1-4个字节表示这个Text对象中字符串的字节数,随后跟着的就是这个字符串的UTF8字节本身。注意Text的前1-4个字节是变长Int,因此后续的正式的...

2018-09-11 16:39:40 1224

原创 Hadoop全局排序(TotalOrderPartitioner)的若干坑点

罗列一些在使用全局排序中的一些坑点,以及解决办法。 1、因错误分区数量而无法读取分区文件 Error: java.lang.IllegalArgumentException: Can't read partitions file at org.apache.hadoop.mapreduce.lib.partition.TotalOrderPartitioner.setConf(Tot...

2018-09-09 02:20:11 1478

原创 如何配置IntelliJ IDEA环境向远端HADOOP测试集群递交Job作业。

前言 刚开始学大数据,由于是分布式环境本地开发好的程序,需要放到测试集群里的跑,来回切换上传非常麻烦,今天终于成功配置出了,在本地IDE环境中也能向测试集群递交Job,甚至获得测试集群历史作业的信息记录。故写下此文以备日后自己查询。 提示:需关闭测试集群的防火墙,或针对IntelliJ IDEA机器IP设定防火墙白名单。 本测试配置环境如下: Hadoop 2.7.4 (伪分布) on Red...

2018-09-07 23:22:45 951 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除