关闭

C#网页数据采集(二)WebBrowser

标签: 数据采集
1263人阅读 评论(0) 收藏 举报
分类:

WebBrowser是一个.NET控件类(设置下web脚本错误忽略)支持获取页面加载完毕的源码,而不是初始化的源码


用到了一个web的一个文档全部加载事件:

调用方法:

  webBrowser1.Navigate("http://news.baidu.com/");//web浏览百度新闻页面

 

   private void webBrowser1_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)

        {

System.IO.StreamReader streamReader = new System.IO.StreamReader(this.webBrowser1.DocumentStream, System.Text.Encoding.GetEncoding("gb2312"));//如果web浏览页面乱码可以使用这个方法进行转码

            string strWebBrowserDocument = streamReader.ReadToEnd();

   }


web的一些属性:

 webBrowser1.Document.Title//获取或设置页面的title

 webBrowser1.Document.Url//当前请求页面的地址

webBrowser1.DocumentText//获取或者设置html内容

webBrowser1.Document.GetElementsByTagName("h3")//获取所有标签为h3的标签

webBrowser1.Document.GetElementById("h3")//获取id为h3的标签

GetAttribute("className");//获取样式名称

GetAttribute("href")//获取a标签的里的url

1
0
查看评论

C#网页采集数据的几种方式(WebClient、WebBrowser和HttpWebRequest/HttpWebResponse)

获取网页数据(采集数据)有很多种方式。在这里主要讲述通过WebClient、WebBrowser和HttpWebRequest/HttpWebResponse三种方式获取网页内容。 这里获取的是包括网页的所有信息。如果单纯需要某些数据内容,可以自己构造函数甄别抠除出来!一般的做法是根据源码的格式,用...
  • jintougao
  • jintougao
  • 2013-10-22 16:42
  • 39794

使用webBrowser采集网页数据

  • 2016-10-31 11:42
  • 1.76MB
  • 下载

简单的网页内容采集器(C#)

  • 2008-03-31 14:48
  • 51KB
  • 下载

【C#】C#实现对网站数据的采集和抓取

首先大家需要清楚一点的是:任何网站的页面,无论是php、jsp、aspx这些动态页面还是用后台程序生成的静态页面都是可以在浏览器中查看其HTML源文件的。     所以当你要开发数据采集程序的时候,你必须先对你试图采集的网站的前台页面结构(HTML)要有所了解。...
  • y112102
  • y112102
  • 2012-03-09 14:12
  • 4733

C#的WebBrowser控件浏览网页

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System....
  • lucky51222
  • lucky51222
  • 2015-03-13 23:40
  • 1185

c# 用webBrowser读取网页源代码

//不能用 this.webBrowser.DocumentText 读取网页源代码,读出来是乱码string url="http://www.yn-home.com";this.webBrowser.Url = new System.Uri(url);  &...
  • try530
  • try530
  • 2006-07-16 14:50
  • 3781

在C#写winform程序时,用webBrowser打开网页时

在C#写winform程序时,用webBrowser打开网页时
  • ncqqbesny
  • ncqqbesny
  • 2014-10-19 15:10
  • 813

通过 WebBrowser 获取网页截图(第二种)

这边提供第二种方式,前一种是用了webbrowser的线程安全,然后开启单线程等到webbrowser加载完成才drawimage来截图,比较稳定,这个方法在用openfiledialog打开文件后通过html的流来作为入参来截取比较稳定,如果用navigate会出现一些截取图片不完整的现象。下面上...
  • orichisonic
  • orichisonic
  • 2015-11-27 10:21
  • 1882

【C#】通过webbrowser控件获取验证码

1、首先介绍下基本控件(拖控件大家都会,我就不一一介绍了),看下图; 2、添加MSHTML引用,步骤如下: 解决方案—右键“引用”—​添加引用—在.NET下找到Microsoft.mshtml组件—点击确定; 3、编写代码,双击button1​按钮添加事件;(注意在引用类中加上using m...
  • u011214284
  • u011214284
  • 2015-03-31 19:35
  • 2258

winform-webbrowser屏蔽网页中的广告

winform-webbrowser屏蔽网页中的广告
  • yangyisen0713
  • yangyisen0713
  • 2014-01-20 14:07
  • 2596
    个人资料
    • 访问:189967次
    • 积分:3223
    • 等级:
    • 排名:第12541名
    • 原创:145篇
    • 转载:1篇
    • 译文:0篇
    • 评论:42条
    文章分类
    最新评论