正则表达式在匹配所需要的字符时往往十分简单方便,如果使用卡但可以省去许多代码。本篇覆盖绝大多数正则表达式的内容,讲述其基本用法和处理流时的用法。
下面给出几张表格,全面列出了正则表达式的内容。选自《Java核心技术》。
补充说明:预搜索
预搜索(位置断言)可以筛出符合位置的字符串
下面给几个例子
材料是大学英语三第一单元:
判断是为给定模式,一般采用下面方法。
Pattern pattern=Pattern.compile("\b[a-z]+\b");
return pattern.matcher(word).matches();
也可以采用asPredicate()方法,将模式转为谓词,来过滤流,这样处理文件时更为方便。
下面给出例子:只选出单词列表中的中文
import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
import java.util.Scanner;
import java.util.regex.Pattern;
import java.util.stream.Collectors;
import java.util.stream.Stream;
/* 单词筛选器
* 可以筛选出英文或中文
* 也可以筛选出指定类型的英文单词
*/
public class WordFilter
{
public static void main(String[] args)
{
Scanner in=new Scanner(System.in);
System.out.println("请输入原文件的绝对路径:");
String path=in.nextLine();
Path file=Paths.get(path);
try(Stream<String> word=Files.readAllLines(file, StandardCharsets.UTF_8).stream())
{
//建立Pattern对象,它可以用来匹配字符串
Pattern pattern=Pattern.compile("[^A-Za-z]+\\s\\D");
//将模式转为谓词,过滤String流。
List<String> result=word.filter(pattern.asPredicate()).collect(Collectors.toList());
for(String line:result)
{
if(line.trim()!=null&line.trim()!=null)
{
System.out.println(line);
}
}
}catch(IOException e)
{
e.printStackTrace();
}
finally {
in.close();
}
}
}
文件处理之后如下:
再比如筛选出以ly结尾的单词
import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
import java.util.Scanner;
import java.util.regex.Pattern;
import java.util.stream.Collectors;
import java.util.stream.Stream;
/* 单词筛选器
* 可以筛选出英文或中文
* 也可以筛选出指定类型的英文单词
*/
public class WordFilter
{
public static void main(String[] args)
{
Scanner in=new Scanner(System.in);
System.out.println("请输入原文件的绝对路径:");
String path=in.nextLine();
Path file=Paths.get(path);
try(Stream<String> word=Files.readAllLines(file, StandardCharsets.UTF_8).stream())
{
//建立Pattern对象,它可以用来匹配字符串
Pattern pattern=Pattern.compile("\\b[A-Za-z]+ly\\b");
//将模式转为谓词,过滤String流。
List<String> result=word.filter(pattern.asPredicate()).collect(Collectors.toList());
for(String line:result)
{
if(line.trim()!=null&line.trim()!=null&!line.contains(" "))
{
System.out.println(line);
}
}
}catch(IOException e)
{
e.printStackTrace();
}
finally {
in.close();
}
}
}
效果如下:
由此可见,正则表达式在处理数据时十分方便,而且在数据库编程,爬虫程序中应用广泛。如果你认为这篇文章有用,可以为作者点个赞!