动易采集教程完整版

动易采集教程完整版

采集管理

采集系统可以直接深入到站点及其网页的所有内容,将网页中的有效数据采集出来(而不仅是网页或链接),并保持数据之间的逻辑关系。对一个新闻站点,它可以将每个新闻的标题、正文等信息单独采集出来,分别作为字段存储在系统中。

采集项目管理
单击左侧管理导航的“采集管理”,出现采集的管理项目:
·文章采集:用于采集设置好的采集项目。
·项目管理:用于建立、管理和复制采集项目。
·过滤管理:用于过滤采集中的标题和正文的字符。
·历史记录:已采集的记录历史,避免重复采集。
·导入|导出:用于共享迁移采集项目。
·定时设置 | 启动定时:用于设置定时采集
·区域采集管理:就是采集网站页面的某个固定区域,并将采集得来的区域代码保存为内联页提供给模板调用,刷新区域采集就可时时更新。

文章采集

1.单击后台左侧管理导航的“采集管理”->“文章采集”,出现“采集系统项目管理”界面:

参数说明:

·选择:选择您要采集的项目,可多选用于批量采集操作。
·状态:如果采集项目没有通过审核,则选择框的颜色为灰暗并不可选,其状态栏显示×。您要必须在“项目管理中”连续通过“采样测试”->“设置属性”这两步,才能通过审核。通过审核的采集项目状态栏显示√。
·上次采集:显示最新的采集日期。
黑色:表示上一次采集的时间。如:2005-5-8 14:45:44。
红色:表示当天采集的时间。如:2005-5-10 11:31:32(如果过了当天时间则会变成黑色)。
·文章采集选项:系统提供了三种采集的样式,包括
->不录入数据库,只测试采集功能是否正常
->采集过程中预览文章内容
->不采集本系统中已经存在相同标题的文章(网站文章超过2万篇以上,请慎用此项)
这几个是多选选项,您可以选择您自己想要的方式,如果都不选择那就是直接把采集的文章写入到数据库中。
·采集模式:提供“稳定采集”、“快速采集”、“链接采集”和“断点采集”四种模式。
->稳定采集:是针对一台服务器有多个动易系统时建议选此项,每采集一篇文章让服务器休息3秒。这样当一台服务器多个动易系统同时采集的时候服务器不受采集影响。
->快速采集:是针对用户拥有一台独立的服务器或配置非常好的服务器使用的采集模式。快速采集将发挥采集的最快速度,采集的效率最高。
->链接采集:就是只采集对方网站的链接,不采集正文。
->断点采集:就是为了采集过程中突然中断提供的一种采集模式,当您上一次采集的时候突然中断后,在您再一次打开采集的时候,断点采集按钮就从灰色不可用转变成为可用按钮,您只要单击按钮就可以从上一次采集断开那一点开始继续采集。减少系统再次检测的时间。
·历史记录:采集项目具有采集统计功能,显示该项目采集成功数和失败数,点击成功失败可看到具体的历史记录信息,并提供采集统计功能。
·采集选项:提供“测试采集”和“正文预览”两项,分别是来测试建立项目成功后是否有效。
·每页项目数:您可以下拉选择每页显示的页数,用于批量采集,比如一次采集20个项目或更多。
·开始采集:勾选了相应采集项目前的选择框,再单击本功能按钮,系统开始进行项目采集与测试。

参数说明:
·管理导航:系统提供采集管理导航操作。
->管理首页:链接到采集系统项目管理首页。
->添加新项目:单击本功能链接添加新的采集项目。
·“操作”列功能链接说明:
->编辑:修改您指定的采集项目。
->测试:测试您的采集项目是否正确,如果显示采集的正文页证明成功,否则会提示您第几步错误。
->属性:设置您采集到的文章,放在那个频道中,那个栏目中,相对应的属性设置。
->复制:如果所采集网站的模板相同,可利用本功能复制多个项目,以提高采集效率。
如果导入采集项目后,就需要审核,是否是正确的采集项目,您必须点要审核项目的,
!采集项目只有

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值