c# 爬虫,图片url和音频url。 控制台程序// url地址下载到本地(MP3,图片)

本文介绍了如何使用C#编写一个简单的爬虫程序,从网页中抓取MP3音乐文件和图片的URL,并将这些资源下载到本地。通过控制台程序实现,详细讲解了URL解析、文件保存等关键步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.IO;
using System.Net;
using System.Text.RegularExpressions;
using HtmlAgilityPack;
using Newtonsoft.Json;



 static void Main(string[] args)
 {

            //var list = new List<info>();
            //list.Add(new info()
            //{
            //    title = "",
            //    url = ""
            //});




            //int count = 1;
            string url = "";  //  需要获取的页面地址
            WebClient wc = new WebClient();
            wc.Encoding = Encoding.UTF8;
            var simpleCrawlResult = wc.DownloadString(url);  //页面文本
            // HtmlDocument htmlDoc = new HtmlDocument();
            // htmlDoc.LoadHtml(simpleCrawlResult);

			// 获取所有a标签
            string prttern = "<a(\\s+(href=\"(?<url>([^\"])*)\"|'([^'])*'|\\w+=\"(([^\"])*)\"|'([^'])*'))+>(?<text>(.*?))</a>";
            var maths = Regex.Matches(simpleCrawlResult, prttern);

            for (int i = 0; i < maths.Count; i++)
            {
                string urls = maths[i].Groups["url"].Value;  //  a标签的链接地址
                string title = maths[i].Groups["text"].Value.Replace("?","?");  //  a标签的内容
                NextLinks(urls, title);
            }
}

//  获取页面接口参数,模拟调用
public static string NextLinks(string url,string title)
{
            WebClient wc2 = new WebClient();
            wc2.Encoding = Encoding.UTF8;
            var simpleCrawlResult2 = wc2.DownloadString(url);
            // HtmlDocument htmlDoc2 = new HtmlDocument();
            // htmlDoc2.LoadHtml(simpleCrawlResult2);
            // HtmlAgilityPack.HtmlNod
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值