BytesWritable使用

最新推荐文章于 2024-06-08 18:05:51 发布

xugen12

最新推荐文章于 2024-06-08 18:05:51 发布

阅读量3.2k

点赞数

分类专栏： Hadoop开发

本文链接：https://blog.csdn.net/xugen12/article/details/49899931

版权

Hadoop开发专栏收录该内容

24 篇文章 0 订阅

订阅专栏

BytesWritable不能作为mapreduce中的key或者value，与ByteWritable不同。

1，BytesWritable.tobyte()，将ByteWritable类型的数据转换为十六进制对，并以空格分开；

2，BytesWritable.set(byte[] newData,int offset,int length);//将值设置为给定的字节范围的副本

3，BytesWritable.copyBytes()//获得对象的byte[]类型全部数据

4，BytesWritable.getBytes()

main(){BytesWritable tt =new BytesWritable();
byte t[] = new byte[]{'t','a','g','u'};
tt.set(t, 0, t.length);
System.out.print(tt);}

main(){BytesWritable tt =new BytesWritable();
byte t[] = new byte[]{'t','a','g','u'};
tt.set(t, 0, t.length);
System.out.print(tt.toString());}

两个输出的结果都为74 61 67 75,是十六进制的流字节，并且用空格隔开，即经过tostring()之后并没有将十进制的数据转换为BytesWritable所对应的字母。

main(){BytesWritable tt =new BytesWritable();
byte t[] = new byte[]{'t','a','g','u'};
tt.set(t, n,t.length);//(n!=0)
System.out.print(tt);}

error:Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException
at java.lang.System.arraycopy(Native Method)
at org.apache.hadoop.io.BytesWritable.set(BytesWritable.java:172)
at cug.TestOrdinary.main(TestOrdinary.java:13)

报错原因是byte[]数组越界，将其改为tt.set(t,n,t.length-n);即可以输出第t位的所有byte数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xugen12

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hadoop深入研究:(十一)——序列化与Writable实现

独自登高楼望断天涯路

07-17

1万+

转载请写明来源地址：所有源码在github上，https://github.com/lastsweetop/styhadoop简介在hadoop中，Writable的实现类是个庞大的家族，我们在这里简单的介绍一下常用来做序列化的一部分。java原生类型除char类型以外，所有的原生类型都有对应的Writable类，并且通过get和set方法可以他们的值。IntWritable和LongWritab

Hive 实战：位图 Bitmap 系列-group_bitmap UDAF 实现解析

最新发布

SmartSi

06-10

1622

在 ClickHouse 中，groupBitmap 函数用于从整数列聚合生成位图，常用于高效地进行复杂的位运算。而在 Hive 中没有内置的等效函数，我们可以通过创建一个用户自定义聚合函数（UDAF）来实现 groupBitmap。这里将详细介绍如何在 Hive 中实现一个类似 groupBitmap 的自定义函数，包括 UDAF 的定义、编译、注册以及使用步骤。

1 条评论您还未登录，请先登录后发表或查看评论

MapReduce中使用BytesWritable类型时要注意

Legend of The Train’s Head

03-10

1569

在MR程序中出现错误，数据读取的内容和原文件不一致，经过定位是因为使用BytesWritable类型导致的。原因见：http://dongxicheng.org/mapreduce-nextgen/hadoop-streaming-process-binary-data/ “BytesWritable，使用这个类型非常容易犯错误。当你把一堆byte[]数据保存到BytesWrit

BytesWritable 存储问题

weixin_34419326的博客

12-29

297

public static void main(String args[]){ BytesWritable cv = new BytesWritable(); String str1 = "1234567"; String str2 = "123450"; cv.set(str1.getBytes(), 0, str1.getBytes().length); Syst...

共享单车之数据分析第1关：统计共享单车每天的平均使用时间

m0_58772685的博客

11-25

3799

共享单车之数据分析第1关：统计共享单车每天的平均使用时间

Hive 实战：位图 Bitmap 系列-bitmap_and 函数实现解析

SmartSi

06-08

1166

在 ClickHouse 中，bitmapAnd 函数用于计算两个位图 Bitmap 的交集，常用于高效地进行复杂的位运算。而在 Hive 中没有内置的等效函数，我们可以通过创建一个用户自定义函数（UDF）来实现 bitmapAnd。这里将详细介绍如何在 Hive 中实现一个类似 bitmapAnd 的 UDF，包括 UDF 的定义、编译、注册以及使用步骤。

共享单车之数据分析第3关：统计共享单车指定车辆每次使用的空闲平均时间

m0_58772685的博客

11-11

6587

packagecom.educoder.bigData.sharedbicycle; importjava.io.IOException; importjava.math.BigDecimal; importjava.math.RoundingMode; importorg.apache.hadoop.conf.Configuration; importorg.apache.hadoop.conf.Configured; importorg.apache.hadoop.hbase....

Hadoop实践（三）---Hadoop数据类型

狮锅艺

10-08

6078

《Hadoop MapReduce实战手册》学习笔记

BytesWritable 长度问题（多出空格）

weixin_30596165的博客

04-30

176

在使用BytesWritable 进行小文件合并时，发现长度与原类容不一致，会多出一些空格测试代码 @Test public void test() { String str = "aaa"; BytesWritable v = new BytesWritable(); v.set(str.getBytes(), 0, str.getBytes...

使用SequenceFile存储BytesWritable类型时要注意

11-12

239

将office文件转为byte[] -> bytesWritable存入SquenceFile中，取出数据时发现文件打不开报错，打印出保存前byte[]和取出后的byte[]长度一看，发现长度不同，后者增加不少...

工作采坑札记：1. Hadoop中的BytesWritable误区

debang2014010的专栏

04-08

458

1. 背景近日帮外部门的同事处理一个小需求，就是将HDFS中2018年至今所有存储的sequence序列化文件读取出来，重新保存成文本格式，以便于他后续进行处理。由于同事主要做机器学习方向，对hadoop或spark方面不了解，所以我就想着这么小的需求，简单支持下即可，花个几分钟写了一个脚本提供给他，没想到，过了一天他又找到我，说脚本读取出来的文件大部分有问题…原来自己代码有bug ...

Hadoop中Writable类之三

weixin_34037515的博客

12-15

107

1.BytesWritable <1>定义 ByteWritable是对二进制数据组的封装。它的序列化格式为一个用于指定后面数据字节数的整数域（4个字节），后跟字节本身。举个例子，假如有一个数组bytes，里面有两个byte，bytes[0]=3，bytes[1]=5,那么，数组序列化后，其返回一个字节数组，序列化方面，可以查看我的博客《Hadoop序列化》，那么序列化后，...

Hadoop中使用自定义的Writable，作为value在map和reduce传递参数。

chjjunking的专栏

09-24

3428

Hadoop中使用自定义的Writable，作为value在map和reduce传递参数。似乎自始至终，传递参数时只有一个Writable存在。这个Writable采用readFields和write改变自身的值，然后传给reduce。因此在重载这两个函数的时候，一定要将上

Hadoop：输入，输出，key，value格式

weixin_30622181的博客

03-31

135

map: (K1, V1) → list(K2, V2) reduce: (K2, list(V2)) → list(K3, V3) (K1, V1): jobConf.setInputKeyClass(K1. class ); jobConf.setInputValueClass(V1. class ); list(K2, V2): job.setMapOutputKey...

【Hadoop】11-序列化

通往神秘的道路的专栏

05-13

876

序列化(serialization）是指将结构化对象转化为字节流以便在网络上传输或写到磁盘进行永久存储的过程。反序列化（deserialiion）是指将字节流转回结构化对象的逆过程。序列化用于分布式数据处理的两大领域：进程间通信和永久存储。在Hadoop中，系统中多个节点上进程间的通信是通过“远程过程调用”(RPC，remote procedure call)实现的。RPC协议将消息序列化成二进制...

消息 ByteBuf 详解

这个人很懒什么都没有~

10-22

3138

markReaderIndex( )与resetReaderIndex( )：这两个方法一起介绍。ctx.writeAndFlush(Bytebufmsg)，Bytebuf缓冲区进入出站处理的流水线。·markWriterIndex()与resetWriterIndex()：这两个方法一起介绍。实例中，然后调用pipeline.fireChannelRead(byteBuf)方法将读取到的数据包送入到入。具体如下：setByte()、setBoolean()、setChar()、

Hadoop学习笔记：MapReduce 编程进阶

narata1的博客

02-15

637

数据类型 Hadoop 使用派生于 Writable 接口的类作为 Mapreduce 计算的数据类型。 value 数据类型，必须实现 org.apache.hadoop.io.Writable 接口，此接口确定了如何进行序列化与反序列化。 key 数据类型必须实现 org.apache.hadoop.io.WritableComparable 接口，定义了键的相互比较。 WritableCom...

DFS针对大数据文件来设计，处理小文件效率低。阅读『File-Based Data Structures』中关于『Hadoop’s SequenceFile』的介绍。编写代码，使用『 SequenceFile 』实现多个小文件的存储。要求如下： 1、开发环境：Intellj IDEA + MAVEN，JDK 1.8, Hadoop 2.9.2 2、写文件：输入：100张图片的文件夹，输出：包含所有图片的SequenceFile格式文件 3、读文件：输入：包含所有图片的SequenceFile格式文件，输出：所有图片压缩后上传程序源文件（压缩文件名：学号_姓名_HDFS.rar）和运行截图。我的答案：

05-18

在上面的代码中，我们使用了 SequenceFile.Writer 来写入 SequenceFile，使用了 SequenceFile.Reader 来读取 SequenceFile。在写入 SequenceFile 时，我们遍历了输入文件夹中的所有文件，并将每个文件的文件名和文件...