C# 获取指定HTML网页中的标签内容

最新推荐文章于 2024-10-17 07:34:29 发布

a123_z

最新推荐文章于 2024-10-17 07:34:29 发布

阅读量1w

点赞数 2

分类专栏： C# 文章标签： html 标签 c#

本文链接：https://blog.csdn.net/a123_z/article/details/73794518

版权

C# 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

首先获取网页内容：

HttpClient client = new HttpClient();

var Result= client.GetStringAsync("http://www.baidu.com/");

Result中的内容如何分割呢？首先可以使用正则表达式的方式，大家可以百度：正则获取HTML标签内的内容

本文分享的是另一种方式：

其实获取指定页面的指定标签在C#中很简单，可以使用Substring截取字符串的方式就可以了。

        /// <summary>
        /// 截取字符串中指定标签内的内容
        /// </summary>
        /// <param name="Content">需要截取的字符串</param>
        /// <param name="start">开始标签</param>
        /// <param name="end">结束标签</param>
        /// <returns></returns>
        public string GetStr(string Content, string start, string end)
        {
            var posStart = Content.IndexOf(start);
            var posEnd = Content.IndexOf(end);
            return Content.Substring(posStart, (posEnd - posStart + end.Length));
        }

这样就OK了。