import java.util.Scanner;
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class Main {
public static void main(String[] args) {
// Scanner sc =new Scanner(System.in);
// // 匹配手机号
// // 第一位只能是1 第二位在 [3-9]之间 其余为任意数字,且只能是9位
// String check = "1[3-9]\\d{9}";
// System.out.println("13123456789".matches(check));// true
// System.out.println("12123456789".matches(check));// false
// System.out.println("93123456789".matches(check));// false
// System.out.println("19123456789".matches(check));// true
//
// // 匹配身份证号
// check = "[1-9]\\d{16}(\\d|X|x)";
// System.out.println("421224200403031518".matches(check));// true
//
// 爬取一段文本的特定数据
String str = "电话: 15629929548" +
"身份证号:421224200403031518";
// 爬取身份证号和密码
String check = "(1[3-9]\\d{9})|([1-9]\\d{16}(\\d|x|X))";
// 1.获取正则表达式的对象
Pattern p1 = Pattern.compile(check);
// 2.获取文本匹配器的对象
Matcher m1 = p1.matcher(str);
// 利用循环获取爬取到的所有数据
while(m1.find()){
String print = m1.group();
System.out.println(print);// 15629929548 421224200403031518
}//相当于// m.find();
// String print = m.group();
// System.out.println(print);
// m.find();
// print = m.group();
// System.out.println(print);
// 贪婪爬取(意思是尽可能多的爬取数据)
str = "abccccc";
// 贪婪爬取
check = "abc+";
// 获取正则表达式对象
Pattern p2 = Pattern.compile(check);
// 获取爬到的所有文本对象
Matcher m2 = p2.matcher(str);
// 循环输出
while(m2.find()){
String print = m2.group();
System.out.println(print);//abccccc
}
}
}
Java 正则表达式(条件爬取,贪婪爬取)
最新推荐文章于 2024-09-13 21:40:38 发布