今天,小编主要为大家介绍一下:前嗅ForeSpider脚本中的标准对象:爬虫链接类url,urltext采集的所有状态及属性类,html标签节点类domItem和(html)dom类dom。具体内容如下:
一.爬虫链接类url
url 类为ForeSpider采集链接地址类,描述了一个链接地址及如何采集的相关属性和操作。常用的属性是:urlname, title, entryid, tmplid这四个属性。
1.类成员:
2.成员方法:
二.urltext采集的所有状态及属性类
urltext 描述当前链接采集的所有状态及属性。
1.类成员:
2.成员方法:无
三.html标签节点类domItem
domItem 类为html的dom文档树标签节点类,通过该类访问和操作dom的标签节点。
1.类成员:
2.成员方法:无
四.(html)dom类dom
dom 类为html的dom文档操作类,该类定义了html文档的所有操作方法和属性。
1.类成员:无
2.成员方法:
三.其他:
Iter函数样例
function domiter(item){ echo(item.name);}