如何读取网页源码然后生成html文件?

如何读取网页源码然后生成html文件? Delphi / Windows SDK/API
http://www.delphi2007.net/DelphiBase/html/delphi_20061219212425113.html
我在网上找了好久没有找到,不知道用哪个函数可以实现?希望给段代码,谢谢了,在线等.

uses   ActiveX,   ComObj;  
  //...  
   
  function   GetHtml(const   WebBrowser:TWebBrowser):   string;//此函数原作者卢小海  
  const  
        BufSize   =   $10000;  
  var  
        Size:   Int64;  
        Stream:   IStream;  
        hHTMLText:   HGLOBAL;  
        psi:   IPersistStreamInit;  
  begin  
        if   not   Assigned(WebBrowser.Document)   then   Exit;  
        OleCheck(WebBrowser.Document.QueryInterface(IPersistStreamInit,   psi));  
        try  
              hHTMLText   :=   GlobalAlloc(GPTR,   BufSize);  
              if   0   =   hHTMLText   then   RaiseLastWin32Error;  
              OleCheck(CreateStreamOnHGlobal(hHTMLText,True,   Stream));  
              try  
                    OleCheck(psi.Save(Stream,   False));  
                    Size   :=   StrLen(PChar(hHTMLText));  
                    SetLength(Result,   Size);  
                    CopyMemory(PChar(Result),   Pointer(hHTMLText),Size);  
              finally  
                    Stream   :=   nil;  
              end;  
        finally  
              psi   :=   nil;  
        end;  
  end;  
   
  procedure   TForm1.Button1Click(Sender:   TObject);  
  var  
      HtmF:Textfile;  
  begin  
      memo1.Text:=gethtml(WebBrowser1);  
      assignfile(HtmF,'c:\result.htm');  
      rewrite(HtmF);  
      writeln(HtmF,memo1.text);  
      closefile(HtmF);  
  end;  
   
  procedure   TForm1.Button2Click(Sender:   TObject);  
  begin  
      webbrowser1.Navigate('http://www.google.com');  
  end;

------------引自   大富翁。    
   
  借助   webbrower   控件。  
   
  webbrower.nagivate('your   url')  
   
   
  8、直接从TWebBrowser得到网页源码及Html  
   
    下面先介绍一种极其简单的得到TWebBrowser正在访问的网页源码的方法。一般方法是利用TWebBrowser控件中的Document对象提供的IPersistStreamInit接口来实现,具体就是:先检查WebBrowser.Document对象是否有效,无效则退出;然后取得IPersistStreamInit接口,接着取得HTML源码的大小,分配全局堆内存块,建立流,再将HTML文本写到流中。程序虽然不算复杂,但是有更简单的方法,所以实现代码不再给出。其实基本上所有IE的功能TWebBrowser都应该有较为简单的方法来实现,获取网页源码也是一样。下面的代码将网页源码显示在Memo1中。  
   
     Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterHtml);  
   
    同时,在用TWebBrowser浏览HTML文件的时候要将其保存为文本文件就很简单了,不需要任何的语法解析工具,因为TWebBrowser也完成了,如下:  
   
     Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);  
   
 

 
  lihuasoft(学习低调做人)      
   
  的   很深  
   
  看不懂

简单的就是最好的。我的也是抄别人的。抛别人的玉引玉。

^  
 

转载于:https://www.cnblogs.com/delphi2007/archive/2008/10/14/1310926.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值