Java 获取Html文本中的img标签下src中的内容

  1. /** 
  2.      * 得到网页中图片的地址 
  3.      * @param sets html字符串 
  4.      */  
  5.     public  Set<String> getImgStr(String htmlStr) {  
  6.         Set<String> pics = new HashSet<String>();  
  7.         String img = "";  
  8.         Pattern p_image;  
  9.         Matcher m_image;  
  10.         String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";  
  11.         p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);  
  12.         m_image = p_image.matcher(htmlStr);  
  13.         while (m_image.find()) {  
  14.             // 得到<img />数据  
  15.             img = m_image.group();  
  16.             // 匹配<img>中的src数据  
  17.             Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);  
  18.             while (m.find()) {  
  19.                 pics.add(m.group(1));  
  20.             }  
  21.         }  
  22.         return pics;  
  23.     }  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值