采集插件,能够采集格式网页上的文本、HTML、元素属性,采集插件可以正则表达式与自定义函数过滤内容。采集插件通过HTTP POST请求方式传输获取数据,采集插件支持CSV、EXCEL、HTML、TXT等下载数据。采集插件的功能具有:定时采集任务、采集规则自动同步功能、脚本采集、数据插件导出。
采集插件是利用其他网站文章列表和缓存读取技术,将其他网站的内容由网页程序自动进行读取,存储的过程为采集过程。是一种信息聚合技术。通过这个技术站长可以不用拷贝粘贴方式将其他站点的相对固定更新的栏目等内容变为自己网站的一部分。采集有站内和站外之分,采集插件站内一般用于较大的站点将很多栏目聚合到一个节点集中呈现。