利用WebBrowser获得页面部分数据

本文介绍了如何利用Microsoft的WebBrowser控件和mshtml.dll组件进行网页数据的抓取。通过创建简单的Web浏览器应用,演示了如何导航到指定网页,获取并操作IHTMLDocument2接口以解析HTML文档,从而实现网页内容的提取。同时,文章讨论了HTML文档的结构,以及在处理复杂网页时如何避免无休止的循环。最后,提出了将数据抓取功能封装到COM DLL中以实现模块化的建议。
摘要由CSDN通过智能技术生成
利用WebBrowser获得页面部分数据
来源: blog.csdn.net发布日期: 2007-2-1 点击数: <script language="javascript" src="../../Click.asp?ID=299" type="text/javascript"></script>123 【打印】【收藏】

Internet Explorer 不只是一个程序,更是许多可重复使用组件的集合与容器。在拆取 Web 页时,最有意思的两个组件是 shdocvw.dll 和 mshtml.dll。第一个组件 shdocvw.dll,包含称为 WebBrowser 的 Microsoft(R) ActiveX(R) 控件,它真实地显示 Web 页。在运行 Internet Explorer 时,显示 Web 页的主窗口就是这样的控件。第二个组件 mshtml.dll,含有能分析 WebBrowser 控件中所包含文档的 HTML 分析器。

可能有这种情况,在您的应用程序内部,已经用 WebBrowser 控件来驻留 Web 页,但仍需要重新创建一个小浏览器来启动 Web 页的拆取。

在文件菜单上,请单击新建工程,以创建“标准 EXE”,然后在工程菜单上单击部件,以添加 Microsoft HTML Object Library 和 Microsoft Internet Controls。

在工具箱中,可看见 WebBrowser 组件。拖动其中之一,文本框和主窗体上的命令按钮。将此文本框的 Text 属性设置为 “http://www.asp001.net/test.htm”,将此命令按钮的 Caption 属性设置为“浏览(&B)”。

双击该命令按钮,然后在事件处理器中放入下列代码,导航至文本框中命名的 Web 站点:
Private Sub Command1_Click()
    WebBrowser1.Navigate Text1.Text
End Sub

保存并运行该程序。试着按浏览按钮,导航到文本框中指定

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

pzhan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值