利用Scanner+Pattern类实现java文本批量扫描

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.Collection;
import java.util.Scanner;
import java.util.regex.Pattern;
/**
* 文本批量扫描 列出文件中所有的单词
* 正则表达式
* @author xiaowei
*
*/
public class StringScanner {
public static void main(String[] args) throws IOException {
InputStream pis=System.in ;
Scanner sp=new Scanner(pis) ; //io扫描
System.out.println("请输入要扫描的路径:");
String path=sp.next() ; //扫描文件路径
File f=new File(path) ;
File[]files=f.listFiles() ;//返回路径下的所有文件
InputStream is=null ;
Scanner s=null ;
Pattern p =null ;
Collection<String> col=new ArrayList<String>() ;
for(File tfile:files){
System.out.println(tfile.getName()+"的单词:");
is=new FileInputStream(tfile) ;//输入
s=new Scanner(is); //文本扫描器
s.useDelimiter("(\\s|\\W|[\\u4e00-\\u9fa5]|\\d)+") ;//设置切分界限 使用文本扫描器一定要注意 。。文本扫描器以此为界限切分
p=Pattern.compile("[a-zA-Z]+",Pattern.MULTILINE) ; //正则表达式编译对象
while(s.hasNext(p)) { //如果存在下一个匹配 那我们匹配下一个
s.next(p) ; //匹配下一个字符串
col.add(s.match().group());//返回匹配结果的第0组正则式
}
System.out.println(col.toString());
col.clear() ;//清空arraylist
is.close() ;
}

}

}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值