利用Scanner+Pattern类实现java文本批量扫描

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.Collection;
import java.util.Scanner;
import java.util.regex.Pattern;
/**
 * 文本批量扫描 列出文件中所有的单词
 * 正则表达式
 * @author xiaowei
 *
 */
public class StringScanner {
 public static void main(String[] args) throws IOException {
  InputStream pis=System.in ;
  Scanner sp=new Scanner(pis) ; //io扫描
  System.out.println("请输入要扫描的路径:");
  String path=sp.next() ;  //扫描文件路径
  File f=new File(path) ;
  File[]files=f.listFiles() ;//返回路径下的所有文件
  InputStream is=null ;
  Scanner s=null ;
  Pattern p =null ;
  Collection<String> col=new ArrayList<String>() ;
  for(File tfile:files){
   System.out.println(tfile.getName()+"的单词:");
   is=new FileInputStream(tfile) ;//输入
   s=new Scanner(is); //文本扫描器
   s.useDelimiter("(\\s|\\W|[\\u4e00-\\u9fa5]|\\d)+") ;//设置切分界限 使用文本扫描器一定要注意 。。文本扫描器以此为界限切分
      p=Pattern.compile("[a-zA-Z]+",Pattern.MULTILINE) ; //正则表达式编译对象 
      while(s.hasNext(p)) { //如果存在下一个匹配 那我们匹配下一个
       s.next(p) ;   //匹配下一个字符串
       col.add(s.match().group());//返回匹配结果的第0组正则式
      }
      System.out.println(col.toString());
      col.clear() ;//清空arraylist
      is.close() ;
  }

 }

}

转载于:https://www.cnblogs.com/yuedongwei/archive/2012/07/13/4145441.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值