Dellphi随记

24 篇文章 0 订阅
全局变量是有范围的:
1、工程范围内,应定义一个单元,专门存放变量;所有的单元uses该单元;
2、单元内全局变量,放在单元的  private中声明的变量,只能在本单元内使用;
3、方法内的全局变量,在方法的Begin之前声明,它只能在本方法内使用,本单元调用其它方法时,它对于其它方法,就是全局变量。


在 Delphi 中进行爬虫可以使用多种方式,其中一种是使用 TWebBrowser 组件来模拟浏览器的行为,从而达到爬取网页的目的。具体步骤如下: 1. 在 Delphi 中创建一个新项目,然后在工具箱中选择 TWebBrowser 组件并将其拖放到窗体上。 2. 在窗体上添加一个按钮,用于触发爬虫操作。 3. 在按钮的 OnClick 事件处理程序中,使用 TWebBrowser 组件的 Navigate 方法加载目标网页。例如: ```delphi WebBrowser1.Navigate('http://www.example.com'); ``` 4. 等待网页加载完成后,使用 TWebBrowser 组件的 Document 属性来获取网页的 HTML 内容。例如: ```delphi Memo1.Text := WebBrowser1.Document.Body.InnerHtml; ``` 5. 解析网页内容,提取需要的信息。可以使用 Delphi 中的正则表达式或者字符串处理函数来实现。例如,假设你要提取网页中的所有链接,可以使用以下代码: ```delphi var Links: TStringList; Doc: Variant; Link: Variant; I: Integer; begin Links := TStringList.Create; try Doc := WebBrowser1.Document; for I := 0 to Doc.Links.Length - 1 do begin Link := Doc.Links.Item(I); Links.Add(Link.Href); end; Memo1.Lines.Assign(Links); finally Links.Free; end; end; ``` 需要注意的是,使用 TWebBrowser 组件进行爬虫操作时,需要注意以下几点: - TWebBrowser 组件使用的是 Internet Explorer 内核,因此可能会存在兼容性问题。你需要确保目标网页能够在 IE 中正常显示,否则可能会导致爬虫失败。 - TWebBrowser 组件加载网页时是异步的,因此你需要等待网页加载完成后才能提取其中的信息。你可以使用 TWebBrowser 组件的 OnDocumentComplete 事件来处理网页加载完成的事件。 - TWebBrowser 组件可能会自动执行网页中的 JavaScript 代码,因此需要注意网页中的 JavaScript 是否会影响到爬虫操作。你可以禁用 TWebBrowser 组件的 JavaScript 支持来避免这个问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值