hadoop IO操作

目录

        io操作中的数据检查

        数据的压缩

        数据IO中的序列化操作

        针对mapreduce的文件类

   一. io操作中的数据检查

        hadoop采用CRC-32(Cyclic Redundancy check ---循环冗余校验,其中的32指生成的校验和是32位的)的方式检验数据完整性,这是一种非常常见的校验和验证方式,检错能力强,开销小,易于实现。

        主要体现在两个方面的数据完整性校验 本地和hdfs.

       1.1 对本地文件的io检查

            本地文件系统的完整性由客户端检查,是在存储和读取的时候检查。

           

       1.2 对hdfs的io数据检查

     1.3 数据恢复策略

二.数据的压缩

      

       

      mapreduce程序指定压缩的方式(其他代码和wordcount一样)

     

  三. 数据IO中的序列化操作

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值