由于项目需要,需要获取网页内容并自动填写表单,所以决定使用webbrowser控件。经过笔者一番百度,我再一次觉得,网上的内容少之又少,大多数都是提交完表单就没事了,那获取提交表单后怎么知道成没成功啊?怎么获取登录成功后的页面呢?所以我在这里讲的全一点:
业务流程大体是:
1.获取一个页面的html代码
2.从中找出type不是submit的<input>标签,填写内容
3.找到所有type是submit的<input>标签,模拟点击提交
4.获取提交后的页面
那么我的解决思路就是:
0X01:为第一次页面加载成功添加一个事件1,为什么要用添加事件的方式呢?因为如果不这样,经常会获取不到webbrowser的DocumentText或者获取不全,导致程序很不稳定。
0X02:自动填写表单并提交。
0X03:这是最关键的一步,先把之前的事件1移除,然后加上加载成功事件2,这样的话在点击登录跳转后不会调用事件1,而会调用事件2,事件2中可以获取webbrowser的DocumentText,就没有问题了(但是需要注意,步骤0X03的代码一定要在点击提交按钮之前,否则提交了再修改事件就来不及了)
首先,不是窗口程序,需要引入using System.Windows.Forms;才能使用webbrowser控件。之后就是代码了:
WebBrowser wb = new WebBrowser();
wb.ScriptErrorsSuppressed = true;
wb.DocumentCompleted += wb_DocumentCompleted;//添加页面第一次加载完成事件
private void wb_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)//网页加载完后调用,但是为什么调用多次????????
{
if (!e.Url.Equals(this.uri))//防止一个网址不明原因的多次调用
{
//not actually complete, do nothing
return;
}
this.htmldocument = wb.Document;
HtmlElementCollection elementcol = this.htmldocument.GetElementsByTagName("input");
wb.DocumentCompleted -= wb_DocumentCompleted;//删除页面加载完成事件
wb.DocumentCompleted += wb_DocumentCompleted2;//添加新的页面加载完成事件(也就是提交成功后页面成功载入事件)
foreach (HtmlElement ele in elementcol)
{
if (!ele.GetAttribute("type").Equals("submit"))//不是提交按钮的都填成123
{
ele.SetAttribute("value","123");
}
else
{
ele.InvokeMember("click");//点击一下
}
}
}
private void wb_DocumentCompleted2(object sender, WebBrowserDocumentCompletedEventArgs e)
{
System.Diagnostics.Debug.WriteLine(wb.DocumentText);
//throw new NotImplementedException();
}