正则表达式提取字符串内所有的img标签下的src路径

/**
 * 提取字符串内所有的img标签下的src
 * @param content
 * @return
 */
public static List<String> getImg(String content){
	 String regex;     
	   List<String> list = new ArrayList<String>();
	   //提取字符串中的img标签
	   regex = "<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>";     
	   Pattern pa = Pattern.compile(regex, Pattern.DOTALL);     
	   Matcher ma = pa.matcher(content);     
	   while (ma.find())     
	   {  
	    //提取字符串中的src路径
	    Matcher m = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(ma.group());
	    while(m.find())
	    {
	    	if("http".equals(m.group(1).substring(0, 4))){//只提取http开头的图片地址
	    		//System.out.println(m.group(1));
	    		list.add(m.group(1));
	    	}
	    }
	   }
	   return list;
	}


转载于:https://my.oschina.net/u/1269027/blog/225149

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值