最近在做爬虫,需要获取文章的基本信息,时间和来源是一起的.
所以就想到用正则表达式提取这段字符串中的时间.
demo如下:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 获取字符串中满足正则表达式的日期字符串
*/
public class Test {
public static void main(String[] args) {
String str = "2015/07/20 11:01 来源: 测试";
String regex = "\\d{4}[-|/]\\d{2}[-|/]\\d{2} \\d{2}:\\d{2}";
Pattern p = Pattern.compile(regex);
Matcher matcher = p.matcher(str);
if (matcher.find()) {
System.out.println(matcher.group());
}
}
}