Hadoop2.7.3 Writable 序列化之一

最新推荐文章于 2022-10-02 10:30:51 发布

若兰幽竹

最新推荐文章于 2022-10-02 10:30:51 发布

阅读量645

点赞数 12

分类专栏： Hadoop2.x

本文链接：https://blog.csdn.net/sujiangming/article/details/115323068

版权

Hadoop2.x 专栏收录该内容

32 篇文章 14 订阅

订阅专栏

本文探讨了在Hadoop 2.7.3中使用Writable接口进行序列化的原因，包括减少带宽消耗和提高通信效率。作者详细介绍了如何实现HadoopPerson类，通过编写测试类展示了序列化和反序列化的步骤，以及实际操作中的文件内容和结果。

摘要由CSDN通过智能技术生成

Hadoop2.7.3 Writable 序列化之一

1. Hadoop序列化背景或原因

Java序列化会附带额外的信息，浪费带宽资源
Java反序列化，会不断创建新的对象，无法实现对象共享
Hadoop处理大文件的特征决定
大数据平台序列化特征：
（1）紧凑：序列化数据，无须携带太多附加信息，减少带宽压力
（2）快速：进程间通信需要高效，需减少序列化和反序列化的开销；
（3）可扩展：系统、协议升级，序列化随着升级
（4）互操作：需支持不同语言间的通信

2. Hadoop Writable机制

在Hadoop中需要实现Writable接口来实现序列化，这个是Hadoop默认的一种序列化方式

3. 实验内容

3.1 思路

思路：借助Java序列化的思路来完成Hadoop序列化测试
	1、创建实现类，实现Writable接口
	2、在实现类中定义成员变量（成员变量的类型都是Java的数据类型）
	3、设置get/set方法、无参构造方法、有参构造方法
	4、重写toString方法
	5、编写测试类

3.2 编写HadoopPerson类

import org.apache.hadoop.io.Writable;
    
    import java.io.DataInput;
    import java.io.DataOutput;
    import java.io.IOException;
    
    public class HadoopPerson implements Writable {
    	//注意这里属性的类型
    	private int id;
    	private String name;
    	private int age;
    	private String phone;
    
    	/**
    	* 必须初始化默认的属性
    	*/
    	public HadoopPerson() {
	    	this.id = 0;
	    	this.name = "";
	    	this.age = 0;
	    	this.phone = "";
    	}
    
    	public HadoopPerson(int id, String name, int age, String phone) {
	    	this.id = id;
	    	this.name = name;
	    	this.age = age;
	    	this.phone = phone;
    	}
    
    	//序列化
    	public void write(DataOutput out) throws IOException {
	    	out.writeInt(this.id);
	    	out.writeUTF(this.name);
	    	out.writeInt(this.age);
	    	out.writeUTF(this.phone);
    	}
    	//反序列化
    	public void readFields(DataInput in) throws IOException {
	    	this.id = in.readInt();
	    	this.name = in.readUTF();
	    	this.age = in.readInt();
	    	this.phone = in.readUTF();
    	}
    
    	@Override
    	public String toString() {
	    	return "HadoopPerson{" +
	    	"id=" + id +
	    	", name=" + name +
	    	", age=" + age +
	    	", phone=" + phone +
	    	'}';
    	}
    
    	public int getId() {
    		return id;
    	}
    
    	public void setId(int id) {
    		this.id = id;
    	}
    
    	public String getName() {
    		return name;
    	}
    
    	public void setName(String name) {
    		this.name = name;
    	}
    
    	public int getAge() {
    		return age;
    	}
    
    	public void setAge(int age) {
    		this.age = age;
    	}
    
    	public String getPhone() {
    		return phone;
    	}
    
    	public void setPhone(String phone) {
    		this.phone = phone;
    	}
    }

3.3 编写测试类

import java.io.*;
    
public class TestMain {

    public static void main(String[] args) throws Exception {
	    // 序列化
	    ser();
	    // 反序列化
	    deSer();
    }
   	//序列化:将HadoopPerson对象写入到本地文件中
   	public static void ser() throws Exception{
	   	//1、创建本地File对象,用于存储HadoopPerson对象
	   	File file = new File("F:\\person.txt");
	   	//2、创建文件输出流对象，用于接收DataOutputStream的字节流，并将其写入到文件中
	   	FileOutputStream outputStream = new FileOutputStream(file);
	   	//3、创建DataOutputStream对象，用于接收HadoopPerson序列化后的字节流，并传递给FileOutputStream对象
	   	DataOutputStream dataOutputStream = new DataOutputStream(outputStream);
	   	//4、利用有参构造函数创建HadoopPerson对象
	   	HadoopPerson person = new HadoopPerson(1001,"苏江明",30,"18275128972");
	   	//4、调用person对象的write方法实现将其序列化后的字节流写入到dataOutputStream对象中
	   	person.write(dataOutputStream);
	   	//5、关闭数据流
	   	dataOutputStream.close();
	   	outputStream.close();
	   	//6、打印提示信息
	   	System.out.println("序列化成功~");
   	}
   	//反序列化:读取本地文件person.txt中的字节流序列将其转成HadoopPerson对象
   	public static void deSer() throws Exception{
    	//1、指定本地File对象
    	File file = new File("F:\\person.txt");
    	//2、创建文件输入流对象，用于读取文件中内容
    	FileInputStream inputStream = new FileInputStream(file);
    	//3、创建DataInputStream对象，用于接收本地文件的字节流，并传递给HadoopPerson对象进行赋值
    	DataInputStream dataInputStream = new DataInputStream(inputStream);
    	//4、利用有无参构造函数创建HadoopPerson对象，调用readFields方法将文件内容赋值给自己
    	HadoopPerson person = new HadoopPerson();
    	person.readFields(dataInputStream);
    	//5、关闭数据流
    	dataInputStream.close();
    	inputStream.close();
    	//6、打印提示信息
    	System.out.println("反序列化成功~" + person);
   	}
   }

4. 实验结果

4.1 调用ser()序列化后文件内容如下

在这里插入图片描述

4.1 调用反序列化方法deSer()结果如下

在这里插入图片描述

若兰幽竹

关注

12
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hadoop2.7.3 Writable 序列化之一

Hadoop2.7.3 Writable 序列化之一1. Hadoop序列化背景或原因2. Hadoop Writable机制3. 实验内容3.1 思路3.2 编写HadoopPerson类3.3 编写测试类4. 实验结果4.1 调用ser()序列化后文件内容如下4.1 调用反序列化方法deSer()结果如下![在这里插入图片描述](https://img-blog.csdnimg.cn/20210330132540656.png)1. Hadoop序列化背景或原因Java序列化会附带额外的信息，浪
复制链接

扫一扫