正则表达式得到网页信息


import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class HtmlTableDataRegex {

public static void main(String[] args) {
String input =
"<table width=\"530\" border=\"0\" cellpadding=\"0\" cellspacing=\"1\" bgcolor=\"#D7D7D7\" class=\"pricetable1\">\r\n" +
"<tr>\n <td align=\"center\">2008-12-10 </td>\n <td align=\"center\">0.7416 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-09 </td>\n <td align=\"center\">0.7334 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-08 </td>\n <td align=\"center\">0.7430 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-05 </td>\n <td align=\"center\">0.7341 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-04 </td>\n <td align=\"center\">0.7289 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-03 </td>\n <td align=\"center\">0.7251 </td>\n </tr>\n" +
"<tr>\n <td align=\"center\">2008-12-02 </td>\n <td align=\"center\">0.7165 </td>\n </tr>\n" +
"\r\n\r\n\t\t" +
"</table>";
Pattern p = Pattern.compile("(?is)<tr[^<>]*>\\s*<td[^<>]*>(.*?)</td>\\s*<td[^<>]*>(.*?)</td>\\s*</tr>");
Matcher m = p.matcher(input);
while (m.find()) {
String part1 = m.group(1).trim();
String part2 = m.group(2).trim();
System.out.println(part1 + ", " + part2);
}
}

}

自己写了个

Pattern p=Pattern.compile("<td[^<>]*>(.*?)</td>");
Matcher m = p.matcher(input);
while (m.find()) {
String part1 = m.group(1).trim();
//String part2 = m.group(2).trim();
System.out.println(part1 + ", " );
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值