火车头采集器

火车头是比较火的采集器,弄懂采集器的运行原理比较重要,那么火车头的采集器基本的采集方法是什么呢,我给讲讲免费版的基本采集方法。

  1. 1

    下载安装火车头采集器,有付费与免费版,百度查找下载地址。(这里不细说)

  2. 2

    下载好后,双击火车头图标打开采集器。

    火车头采集器教程
  3. 3

    进入火车头主程序页面。

    火车头采集器教程
  4. 4

    单击新建的黑小三角,新建任务。

    火车头采集器教程
  5. 5

    填写任务名,点击第二步。(采集网址不截了,以防广告)

    火车头采集器教程
  6. 6

    分析目标页面,找到要采集的内容。

    火车头采集器教程
  7. 7

    查看源文件,找到要采的内容(复制内容去搜索)

    火车头采集器教程
  8. 8

    建议用360浏览器或者360极速浏览器,找到目标内容,分析目标内容前后的代码。

    火车头采集器教程
  9. 9

    此时标题的前后代码为“<h2>”、“</h2>”。

    火车头采集器教程
  10. 10

    双击采集器“标题”。

    火车头采集器教程
  11. 11

    选择前后截取,把前后代码分别填进去,如图。

    火车头采集器教程
  12. 12

    或者,选择正则提取,如图,点击确认。

    火车头采集器教程
  13. 13

    标题采集规则制作完成,开始分析其他标签规则。

    内容中有不要的代码(如图div代码不要),可以排除。

    火车头采集器教程
  14. 14

    双击内容,进入数据处理,点击添加,出现菜单,选择html标签过滤。

    火车头采集器教程
  15. 15

    勾选不要的代码。

    火车头采集器教程
  16. 16

    检查要的内容是否全部采集进来了。

    火车头采集器教程
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值