初次使用Winform抓取数据的一点心得
(一)字符串截取及正则表达式。
字符串截取主要使用的两个函数String.IndexOf()以及String.Substring(),前者主要找到需要截去的内容或者找到需要保存的内容,后者主要是截去不需要的内容。两者混合使用即可得到想要的内容。或者使用正则表达式做字符串匹配。通过webBrowser加载网页,并获取其中的HTML的元素。例如获取<div>标签:
webBrowser1.Document.GetElementsByTagName("div");这就获取到了HTML中的所有div标签元素。假设我们当前获取的一个div元素为item。那么item.InnerHtml或者 item.InnerText就获得了该div中的内容。之后我们就可以使用字符串截取或者是正则表达式匹配来获取相应的内容。