首先获取网页内容:
HttpClient client = new HttpClient();
var Result= client.GetStringAsync("http://www.baidu.com/");
Result中的内容如何分割呢? 首先可以使用正则表达式的方式,大家可以百度:正则获取HTML标签内的内容
本文分享的是另一种方式:
其实获取指定页面的指定标签在C#中很简单,可以使用Substring截取字符串的方式就可以了。
/// <summary>
/// 截取字符串中指定标签内的内容
/// </summary>
/// <param name="Content">需要截取的字符串</param>
/// <param name="start">开始标签</param>
/// <param name="end">结束标签</param>
/// <returns></returns>
public string GetStr(string Content, string start, string end)
{
var posStart = Content.IndexOf(start);
var posEnd = Content.IndexOf(end);
return Content.Substring(posStart, (posEnd - posStart + end.Length));
}
这样就OK了。