Java正则表达式在流中的使用

正则表达式在匹配所需要的字符时往往十分简单方便,如果使用卡但可以省去许多代码。本篇覆盖绝大多数正则表达式的内容,讲述其基本用法和处理流时的用法。
下面给出几张表格,全面列出了正则表达式的内容。选自《Java核心技术》。
表2-6
表2-6续


补充说明:预搜索
预搜索
预搜索(位置断言)可以筛出符合位置的字符串

下面给几个例子
材料是大学英语三第一单元:
英语单词
判断是为给定模式,一般采用下面方法。

Pattern pattern=Pattern.compile("\b[a-z]+\b");
	return pattern.matcher(word).matches();

也可以采用asPredicate()方法,将模式转为谓词,来过滤流,这样处理文件时更为方便。
下面给出例子:只选出单词列表中的中文

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
import java.util.Scanner;
import java.util.regex.Pattern;
import java.util.stream.Collectors;
import java.util.stream.Stream;

/* 单词筛选器
 * 可以筛选出英文或中文
 * 也可以筛选出指定类型的英文单词
 */
public class WordFilter
{
	
	public static void main(String[] args)
	{
		Scanner in=new Scanner(System.in);
		System.out.println("请输入原文件的绝对路径:");
		String path=in.nextLine();
		Path file=Paths.get(path);
		try(Stream<String> word=Files.readAllLines(file, StandardCharsets.UTF_8).stream())
		{
			//建立Pattern对象,它可以用来匹配字符串
			Pattern pattern=Pattern.compile("[^A-Za-z]+\\s\\D");
			
			//将模式转为谓词,过滤String流。
			List<String> result=word.filter(pattern.asPredicate()).collect(Collectors.toList());
			for(String line:result)
			{
				if(line.trim()!=null&line.trim()!=null)
				{
					System.out.println(line);
				}
			}
		}catch(IOException e)
		{
			e.printStackTrace();
		}
		finally {
			in.close();
		}
	}
}

文件处理之后如下:
效果图
再比如筛选出以ly结尾的单词

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
import java.util.Scanner;
import java.util.regex.Pattern;
import java.util.stream.Collectors;
import java.util.stream.Stream;

/* 单词筛选器
 * 可以筛选出英文或中文
 * 也可以筛选出指定类型的英文单词
 */
public class WordFilter
{
	
	public static void main(String[] args)
	{
		Scanner in=new Scanner(System.in);
		System.out.println("请输入原文件的绝对路径:");
		String path=in.nextLine();
		Path file=Paths.get(path);
		try(Stream<String> word=Files.readAllLines(file, StandardCharsets.UTF_8).stream())
		{
			//建立Pattern对象,它可以用来匹配字符串
			Pattern pattern=Pattern.compile("\\b[A-Za-z]+ly\\b");
			
			//将模式转为谓词,过滤String流。
			List<String> result=word.filter(pattern.asPredicate()).collect(Collectors.toList());
			for(String line:result)
			{
				if(line.trim()!=null&line.trim()!=null&!line.contains(" "))
				{
					System.out.println(line);
				}
			}
		}catch(IOException e)
		{
			e.printStackTrace();
		}
		finally {
			in.close();
		}
	}
}

效果如下:
效果图

由此可见,正则表达式在处理数据时十分方便,而且在数据库编程,爬虫程序中应用广泛。如果你认为这篇文章有用,可以为作者点个赞!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值