上周,做了一项简单的任务,就是从网页中筛选出日期,然后就从网上差了一下,网上大部分都是用一个正则表达式只匹配一个特定格式的日期,但不同网页中得日期又很多格式,索性自己写了一个正则表达式来匹配多种格式的日期。
String reg = "([0-9]{2,4})[-|/|年|.]([0-9]{1,2})[-|/|月|.]{1,2}([0-9]{1,2})";
Matcher m = Pattern.compile(reg).matcher("sdf2012.2.1");
while(m.find())
{
System.out.println("日期:"+m.group(1)+"-"+m.group(2)+"-"+m.group(3));
}
当然,上面的正则表达是也有其缺点,贴出来跟大家分享分享,大家多多指点。