hadoop的数据序列化类型

hadoop的数据序列化类型
        IntWritable,FloatWritable,LongWritable,DoubleWritable,Text,
        BooleanWritable,ByteWritable,MapWritable,ArrayWritable

    JAVA的数据类型
        int,float,long,double,string,boolean,byte,map,array

    为什么要序列化?
        序列化就是把内存当中的对象,转换成字节序列比便于存储和网络传输
            存储“活的对象”
            hadoop序列化实现了hadoop的上传和下载
            java序列化实现了网络传输
        反序列化就是将收到的字节序列或者硬盘的持久化数据,转换成内存中的对象。

    java的序列化->Serializable
    为什么不用java提供的序列化接口?
        java的序列化是一个重量级的序列化框架,一个对象被序列化后会附带很多额外的信息(校验信息,header,继承体系等)。
        不便于在网络中的高效传输,所以hadoop开发了一套序列化机制(Writable),精简/高效。

    为什么序列化在hadoop中很重要?
        hadoop通信是通过远程调用(rpc)实现的,需要进行序列化


    特点:
        1)紧凑
        2)快速
        3)可拓展
        4)互操作

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值