用NSoup解析HTML

1.在NuGet程序包中添加NSoup包

public static void TestNSoup(string urlStr)
        {
            WebClient wc = new WebClient();
            byte[] htmlByte = wc.DownloadData(urlStr);
            string html = Encoding.UTF8.GetString(htmlByte);
            //声明Document对象
            Document doc = NSoupClient.Parse(html);

            //直接通过url来获取Document对象
            Document doc1 = NSoupClient.Connect(urlStr).Get();

            Elements div = doc1.GetElementById("标签id").GetElementsByTag("标签名如,div");

            //通过id获取元素
            Element userNames = doc.GetElementById("标签id");
            //通过标签名获取元素
            Elements p = doc.GetElementsByTag("p");

            //通过类样式获取元素 
            Elements btnNews = doc.GetElementsByClass("btn-news");

            //通过属性获取
            Elements attrstyle = doc.GetElementsByAttribute("style");

            //遍历获取到的标签
            foreach (Element item in div)
            {
                Console.WriteLine(item.Html());
            }
        }

 

转载于:https://www.cnblogs.com/sanday/p/11430286.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值