html正则匹配img src,如何用正则表达式获取文章内容中的<img标签和 src的路径

怎么用正则表达式获取文章内容中的

正则:

查找Img标签开头的图片路径

[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?.*?(\.gif|\.jpg|\.png))

查找Function中的图片路径

[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)

查找background标签的图片路径

background="(?[^"]+)

查找URL的图片路径

:[\s]*url[\s]*\([\s"']*(?["']*[^)]+)

通用的:

("|')(?[^"']+?(\.gif|\.png|\.jpg))("|')

url\(['\"]?\s*(?[^>]+?)['\"]?\s*\)

Cimg[\d+]*[\s]*\([\s"']*(?[^"')]+)

private IList MatchImgPath(string content, string regexPattern)

{

IList _ret = new List();

Regex reg = new Regex(regexPattern);

string _imgPath = "";

MatchCollection mc = reg.Matches(content);

if (mc != null && mc.Count > 0)

{

foreach (Match match in mc)

{

if (match.Success == false || match.Value == null || match.Value == "")

continue;

foreach (string name in reg.GetGroupNames())

{

if (name == null || name == "" || name == "0")

continue;

if (name == "ref_value"

&& match.Groups[name].Value != null

&& match.Groups[name].Value != "")

{

_imgPath = match.Groups[name].Value;

if(!_ret.Contains(_imgPath.ToLower()))

_ret.Add(_imgPath.ToLower());

}

}

}

}

return _ret;

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值