最大化参数 火车头_火车头采集器教程:使用正则匹配模式采集数据

使用正则匹配模式采集数据

正则表达式很强大,利用它我们可以获得一定格式的数据,比如网址,E-mail地址,数字,字母等等.可喜的是,从3.2版开始,火车 采集器就支持正则规则的编写了,这给喜欢用正则来实现不同需求的朋友带来福音。火车采集器里支持两种正则,一个纯正则,一个参数正则。我们下边分开讲一 下。

1.纯正则:

先看一下图

在标签中用正则表达式采内容的格式是这样:

开始代码(?正则表达式)结束代码

其中在开始代码和结束代码中如有需要转义的字符就要用转义。

比如我们要获取火车论坛的版块,我们从首页获取,正则可以这样写

论坛记 事、活动、培训区|||悬赏求助区|||采集器讨论区|||使用教程区|||模块资源区|||站点任务规则资源区|||BUG报告|||采集器资源求购 区|||程序建议区|||火车嘉宾,VIP会员,捐助会员技术支持区|||Discuz! | & Supsite|||PHPWind & VeryCMS|||PHPCMS|||DedeCMS|||Powereasy动易|||WordPress 等Blog程序|||ECMS帝国|||新云程序|||建站交流|||SEO技术交流|||网站系统经验分享

然后就可以获得我们需要的版块名称了。

2.参数正则

这个不算是正则,和网址采集那块的参数使用原理是一样的,可以对采到的内容进行组合。输入框两边都不得为空,后边的组合结果参数几是按匹配内容的顺 序来写的,我们还是以http://bbs.locoy.com/为例,来获得栏目ID和栏目名称。

测试一下,是可以获得我们需要的结果了。^_^  。

正则基本就这样,主要是写表达式的问题。如果您对这有兴趣,可以下载相关一些资料研究一下。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值