WebBrowser之获取跳转页面的Document接口源码

//
// 备注:本篇文章来自 vc驿站: http://www.cctry.com/thread-254314-1-1.html
// C、C++、VC++ 各种学习资源,免费教程,期待您的加入!

//

问题由来是这样的,今天一个会员问我一个问题,说从咱们VC驿站下载了一个源码,程序的功能主要是在对话框上面放置了一个WebBrowser控件,程序启动的时候默认调用这句代码:

  1. m_web.Navigate(_T("https://www.baidu.com/s?wd=400电话"), NULL, NULL, NULL, NULL);
复制代码

打开这个网址:
https://www.baidu.com/s?wd=400电话 ,如下图:

点击【获取测试】按钮之后,执行如下函数:

  1. void CCctryDlg::OnBnClickedButton1()
  2. {
  3.         //----------------------------------------------------------------------------------
  4.         CComQIPtr <IHTMLDocument2, &IID_IHTMLDocument2> spDoc1 = m_web.get_Document();

  5.         IHTMLDocument3 *pDoc3 = NULL;
  6.         HRESULT hr = spDoc1->QueryInterface(IID_IHTMLDocument3, (void **)&pDoc3);
  7.         if (!pDoc3 && FAILED(hr)) return;

  8.         CComPtr <IHTMLElement> pUserElement;
  9.         CComBSTR idName(CT2OLE(_T("kw"))); //获取编辑框元素ID
  10.         hr = pDoc3->getElementById(idName, &pUserElement);
  11.         if (FAILED(hr) ||!pUserElement) return;

  12.         pUserElement->put_innerText(CComBSTR("新网页")); //写入字符串

  13.         CComPtr <IHTMLElement> pBtnElement;
  14.         CComBSTR idBtnName(CT2OLE(_T("su")));//获取表单按钮的元素ID
  15.         hr = pDoc3->getElementById(idBtnName, &pBtnElement);
  16.         if (FAILED(hr) || !pBtnElement) return;
  17.         pBtnElement->click(); //模拟点击百度按钮进行搜索

  18.         //----------------------------------------------------------------------------------

  19.         //获取点击百度按钮之后的所有链接
  20.         Sleep(5000); //加载完毕新打开的网页

  21.         //再次重新获取,但是得到的链接还是原来400电话里面的,而不是新网页里的。
  22.         CComQIPtr <IHTMLDocument2, &IID_IHTMLDocument2> spDoc2 = m_web.get_Document();
  23.         GetAllLinks(spDoc2);
  24. }
复制代码


简单解释一下:就是获取百度搜索框的接口,之后向里面输入关键字:“新网页”,之后再获取【百度一下】按钮的接口,调用这句话 pBtnElement->click(); 进行点击事件的触发,说白了,就是在当前页面中搜索 “新网页” 这个关键字。
之后,调用 Sleep(5000); 等待一会新页面加载完成,再次调用 m_web.get_Document(); 获取当前网页的 document 文档接口,然后调用 GetAllLinks(spDoc2); 函数分析出当前页面的所有搜索结果的URL链接,显示在软件下面的列表中,如下图:


但是,问题来了,大家仔细看上面的图,列表中显示的URL链接都是上一个网址搜索 “400电话” 关键字的结果,不是之后搜索的关键字 “新网页” 的网址链接,这是怎么回事儿呢?跟我们要的结果不一致啊。。。
我还特意调用了 Sleep(5000),等待了 5 秒钟 呢,怎么结果还是不对?

于是乎。。。东奔西走,谷歌搜索了一大堆,还是没找到结果,到微软官方MSDN也没发现什么猫腻,到底是怎么回事儿呢,正准备要放弃的时候,忽然灵感来了, 想一想,WebBrowser 走的是当前的主界面的 UI 线程,所以,他访问网页的过程也是在这个主界面的线程中来执行的,那么我们 Sleep(5000); 就没有意义了,不仅会卡住主界面线程,也同时会卡住 WebBrowser。当程序调用完 GetAllLinks(spDoc2); 这条语句之后可能新页面还没加载完,所以获取子链接的结果肯定是上一个页面的。

于是按照这一思想,我把【获取测试】按钮响应函数中的以下几句话注释掉:
  1. Sleep(5000); //加载完毕新打开的网页
  2. CComQIPtr <IHTMLDocument2, &IID_IHTMLDocument2> spDoc2 = m_web.get_Document();
  3. GetAllLinks(spDoc2);
复制代码


即,不让他 Sleep 了,也不让他在当前的这个按钮的响应函数中去获取新页面中所有的子链接,直接触发【百度一下】按钮点击事件之后就完事儿了。
接着,我再界面上再添加一个按钮,命名为【再测试下】,在这个按钮的响应函数中添加如下代码:
  1. CComQIPtr <IHTMLDocument2, &IID_IHTMLDocument2> spDoc2 = m_web.get_Document();
  2. GetAllLinks(spDoc2);
复制代码


即,在这个【再测试下】按钮的响应函数中进行获取新页面中的所有子链接,看看能否成功!结果呢?哈哈,当然是成功啦,如下图:
 

看到了吧,这回列表中显示的已经是新页面的网页子链接了。。。

好了,文章就写到这吧,希望其他遇到相同问题的网友看到这篇文章,少走弯路!  


相关工程源码,请到原帖下载:

//
// 备注:本篇文章来自 vc驿站:http://www.cctry.com/thread-254314-1-1.html
// C、C++、VC++ 各种学习资源,免费教程,期待您的加入!
//

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值