火车头采集器

火车头是比较火的采集器,弄懂采集器的运行原理比较重要,那么火车头的采集器基本的采集方法是什么呢,我给讲讲免费版的基本采集方法。

  1. 1

    下载安装火车头采集器,有付费与免费版,百度查找下载地址。(这里不细说)

  2. 2

    下载好后,双击火车头图标打开采集器。

    火车头采集器教程
  3. 3

    进入火车头主程序页面。

    火车头采集器教程
  4. 4

    单击新建的黑小三角,新建任务。

    火车头采集器教程
  5. 5

    填写任务名,点击第二步。(采集网址不截了,以防广告)

    火车头采集器教程
  6. 6

    分析目标页面,找到要采集的内容。

    火车头采集器教程
  7. 7

    查看源文件,找到要采的内容(复制内容去搜索)

    火车头采集器教程
  8. 8

    建议用360浏览器或者360极速浏览器,找到目标内容,分析目标内容前后的代码。

    火车头采集器教程
  9. 9

    此时标题的前后代码为“<h2>”、“</h2>”。

    火车头采集器教程
  10. 10

    双击采集器“标题”。

    火车头采集器教程
  11. 11

    选择前后截取,把前后代码分别填进去,如图。

    火车头采集器教程
  12. 12

    或者,选择正则提取,如图,点击确认。

    火车头采集器教程
  13. 13

    标题采集规则制作完成,开始分析其他标签规则。

    内容中有不要的代码(如图div代码不要),可以排除。

    火车头采集器教程
  14. 14

    双击内容,进入数据处理,点击添加,出现菜单,选择html标签过滤。

    火车头采集器教程
  15. 15

    勾选不要的代码。

    火车头采集器教程
  16. 16

    检查要的内容是否全部采集进来了。

    火车头采集器教程
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值