正则表达式可以用一些规定的字符来制定规则,并用来校验数据格式的合法性。
推荐学习:正则表达式
正则表达式支持爬取信息:
String str1 = "电话028-29586748,或者邮箱12873213@qq.com"+
"电话028-22136748,或者邮箱333873213@qq.com"+
"电话18161666666,或者邮箱128722113@163.com";
//从上面内容爬取电话号码和邮箱
//1.定义爬取规则
String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|(1[3-9]\\d{9})|(0[2-5]\\d{1,9}-?\\d{8})|(400-?\\d{3,8}-?\\d{3,8})";
//2.把正则表达式进行编译成为一个匹配规则对象
Pattern compile = Pattern.compile(regex);
//3.通过匹配规则对象得到一个匹配数据内容的匹配器对象
Matcher matcher = compile.matcher(str1);
//4.通过匹配器去内容中爬取信息
while(matcher.find()){
String rs=matcher.group();
System.out.println(rs);
}