RCFileInputFormat的使用方法

在使用RCFileInputFormat时可以设置需要读取的列的序号:

  /**

   * Sets read columns' ids(start from zero) for RCFile's Reader. Once a column

   * is included in the list, RCFile's reader will not skip its value.

   * 

   */

  public static void setReadColumnIDs(Configuration conf, ArrayList<Integer> ids) {

    String id = toReadColumnIDString(ids);

    setReadColumnIDConf(conf, id);

  }

如果使用RCFileInputFormat,在map当中传入的value为数据库表的一行。如要读取该行的每一列可以使用如下方法:

String[] columns = new String[columnNum];

for(int i=0;i<columnNum;i++){

columns[i]= new String(value.get(i).getData(),value.get(i).getStart(),

Value.get(i).getLength());

   }

其中,columnNum为读取的列数,然后在for循环中构造每一列。在这里可能会有疑问的地方,为什么每一列还需要startlength呢?因为value.get(i).getData()获取的是该行所有列的数据,不是针对该列的数据,所以需要“开始位置”和“长度”。在这里我们或许还可以推定:该行所有列value.get(i).getData()的方法其实是共享了一个byte数组。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值