java使用正则获取字符串HTML代码段中的内容 节点属性值

public static List<String> match(String source,String reg) {  
            List<String> result = new ArrayList<String>();  
            Matcher m = Pattern.compile(reg).matcher(source);  
            while (m.find()) {  
                String r = m.group(1);  
                result.add(r);  
            }  
            return result;  

        }



public static void main(String[] args) {  
             //要进行获取的字符串文章
              String ss=" <html><body><img src=\"/img/loading.gif\"> <script type=\"text/javascript\">"
                        +"$('body').append('<img id=\"nimg\" style=\"display:none;\" src=\"http://qrcode.41.cn/yc/qrcode/mb?orderNo=3063646075884371&amt=11.0&tradeDate=20161111&bankCode=WEIXIN&merchUrl=1L4%2FNMk5Whq5XzYy2%2B3nRufsBmmRuyoE%2FxoVeJK%2BK%2FOeEb1e08eODusFs7M7CHa8fQtKKadQJuc%3D&reqUrl=8785%2FPayMobao%2Fmobao%2Fpay.do&mac=1f244432485d4287b4ed2a28cc578948\"/>');"
                        +"var nimg = $('#nimg');nimg.on('load', function() {img.remove();nimg.appendTo(pimg);nimg.removeAttr('style');});})();});</script> </body></html>";
            

String reg = "<img[^<>]*?\\ssrc=['\"]?(.*?)['\"]?(\\s.*?)?>";  
              List<String> list = match(ss,reg); 

           //list.get(1);获取第二个img的src属性值

            System.out.println(list.get(1));  
        } 


比如,我查询<ahref=/"index.html/">index</a>中<a href></a>间的数据,可写作<a.*href=/".*/">(.+?)</a>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值