Java 正则表达式爬取内容
public static void main(String[] args) {
String str1 = "电话028-29586748,或者邮箱12873213@qq.com"+
"电话028-22136748,或者邮箱333873213@qq.com"+
"电话18161666666,或者邮箱128722113@163.com";
//从上面内容爬取电话号码和邮箱
//1.定义爬取规则
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|(1[3-9]\\d{9})|(0[2-5]\\d{1,9}-?\\d{8})|(400-?\\d{3,8}-?\\d{3,8})";
//2.把正则表达式进行编译成为一个匹配规则对象
Pattern compile = Pattern.compile(regex);
//3.通过匹配规则对象得到一个匹配数据内容的匹配器对象
Matcher matcher = compile.matcher(str1);
//4.通过匹配器去内容中爬取信息
while(matcher.find()){
System.out.println(matcher.group());
}
}