public static void main(String[] args) {
//通过正则表达式来爬取里面的电话,邮箱,座机号码,热线;
String data = "HEllo," +
"电话:18666668888,18699997777或者联系" +
"邮箱:boniu@itcast.cn 邮箱:bozai@itcast.cn 邮箱2:dlei0009@163.com" +
"座机电话:01036517895,010-98951256 " +
"热线电话:400-618-9090 ,400-618-4000,4006184000,4006189090";
//里面信息的正则表达式
String regex = "[1][3-9]\\d{9}|\\w+[@][\\w&&[^_]]+(\\.[a-z]{2,3})+|[0]\\d{2,3}-?\\d{7,8}|400-?\\d{3}-?\\d{4}";
// 1. 将正则表达式封装为 Pattern 对象
Pattern pattern = Pattern.compile(regex);
//通过pattern.matcher()方法获取匹配器对象
Matcher matcher = pattern.matcher(data);
//通过循环来获取里面的值
//matcher.find()是查找,如果有匹配的就调用matcher.group()方法来获取,理解起来和XXX.next()方法有点像
while (matcher.find()){
System.out.println(matcher.group());
}
}
Java中使用正则表达式爬取一段文字中的特定部分思路
于 2023-08-13 21:17:21 首次发布