利用WebClient正则表达式下载资源

//我们拿下载图片举个例子
static WebClient client = new WebClient();
class Program
{
static WebClient client = new WebClient();

    static void Main(string[] args)
    {
    string[] str = GetHvtImgUrls(@"http://www.imooc.com/");//下载地址
        string url = "";
        for (int i = 0; i < str.Length; i++)
        {
            url = str[i];
            if (url.EndsWith(".jpg"))//判断是否是以jpg来结尾的
            {
                if (!url.Contains("http:"))//判断是不是以hppt:开头的
                {
                    url = "http:" + url;
                }

                string filepath = @"D:\path练习\" + Guid.NewGuid() + ".jpg";
                client.DownloadFile(url, filepath);
            }
        }

    }

    /// <summary> 
    /// 取得HTML中所有图片的 URL。 
    /// </summary> 
    /// <param name="sHtmlText">HTML代码</param> 
    /// <returns>图片的URL列表</returns> 
    public static string[] GetHvtImgUrls(string url)
    { string content = client.DownloadString(url);//获取返回的信息
     // 定义正则表达式用来匹配 img 标签 (正则表达式很多,若想了解跟多欢迎点击https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1700215?fr=aladdin)
  Regex m_hvtRegImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase);

        // 搜索匹配的字符串 
        MatchCollection matches = m_hvtRegImg.Matches(content);
        int m_i = 0;
        string[] sUrlList = new string[matches.Count];
        // 取得匹配项列表 
        foreach (Match match in matches)
        sUrlList[m_i++] = match.Groups["imgUrl"].Value;
        return sUrlList;
    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值