hadoop的 pathfilter使用

Hadoop的PathFilter使用

源码接口定义:

[java]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. public interface PathFilter {  
  2.   /** 
  3.    * Tests whether or not the specified abstract pathname should be 
  4.    * included in a pathname list. 
  5.    * 
  6.    * @param  path  The abstract pathname to be tested 
  7.    * @return  <code>true</code> if and only if <code>pathname</code> 
  8.    *          should be included 
  9.    */  
  10.   boolean accept(Path path);  
  11. }  


用法:

[java]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. static class TextPathFilter extends Configured implements PathFilter {  
  2.         @Override  
  3.         public boolean accept(Path path) {        
  4.             FileSystem fs;  
  5.             try {                 
  6.                 fs = FileSystem.get(getConf());  
  7.                 FileStatus fstatus = fs.getFileStatus(path);  
  8.                 List<String> lstName = new ArrayList<String>();  
  9.                 lstName.add("input1");  
  10.                 lstName.add("input2");  
  11.                 lstName.add("input3");  
  12.                 lstName.add("input4");                            
  13.                 if(fstatus.isDirectory()) {   //是目录的话返回true  
  14.                     return true;  
  15.                 }  
  16.                 if(fstatus.isFile() && lstName.contains(fstatus.getPath().getParent().getName())) {  //是文件的话且满足过滤条件返回true  
  17.                     return true;                                          
  18.                 }  
  19.             } catch (IOException e) {  
  20.                 e.printStackTrace();  
  21.             }  
  22.               
  23.             return false;  
  24.         }  
  25.           
  26.     }  


Driver类写的:

[java]  view plain  copy
 print ? 在CODE上查看代码片 派生到我的代码片
  1. FileInputFormat.addInputPath(job, new Path(otherArgs[0]));    //输入路径  
  2. FileInputFormat.setInputDirRecursive(job, true);// 递归输入  
  3. FileInputFormat.setInputPathFilter(job, TextPathFilter.class);   //指定pathfilter类  
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值