采集规则七:河溪小说网 www.518cqdl.com 适用于-易读系统小说站河溪小说网的采集规则

有朋友说不会替换和查找过滤,那我就一个一个站弄下吧。没多少时间,一天发一个吧,这次是雯雯文学。

首先要过滤掉他网站的广告。过滤信息在 <PubContentText>这。可以参考下。也许还有我不知道的广告,你们可以进他的网站内页多点一下找一下看看。www.518cqdl.com

这个规则易读的采集器是可以适应的。关关不知道是否可以用。



<?xml version="1.0" encoding="UTF-8"?>
<RuleConfigInfo xmlns:xsi="https://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="https://www.w3.org/2001/XMLSchema">
 <NovelIntro>
  <RegexName>NovelIntro</RegexName>
  <Pattern>&lt;meta property="og:description" content="((.|\n)*?)"/&gt;</Pattern>
  <Method/>
  <FilterPattern/>
  <Options/>
 </NovelIntro>
 <PubContentText>
  <RegexName>PubContentText</RegexName>
  <Pattern>&lt;div id="content"&gt;((.|\n)*?)&lt;/div&gt;</Pattern>
  <Method/>
  <FilterPattern>河溪小说
手机站-m.518cqd.com 
www.518cqdL.com
m.518cqdL.com
&lt;script.+?&lt;/script&gt;|&lt;div.+?&gt;|&lt;/div&gt;|&lt;p&gt;|&lt;/p&gt;
【&lt;b&gt;(.|\n)*?&lt;/B&gt;】♂</FilterPattern>
  <Options/>
 </PubContentText>
 <NovelSearchUrl>
  <RegexName>NovelSearchUrl</RegexName>
  <Pattern/>
  <Method/>
  <FilterPattern/>
  <Options/>
 </NovelSearchUrl>
 <NovelList_GetNovelKey>
  <RegexName>NovelList_GetNovelKey</RegexName>
  <Pattern>&lt;span class="s2"&gt;&lt;a href="/info/.+?/(.+?).html"&gt;.+?&lt;/a&gt;</Pattern>
  
  <Method/>
  <FilterPattern/>
  <Options/>
 </NovelList_GetNovelKey>
 <NovelListUrl>
  <RegexName>NovelListUrl</RegexName>
  <Pattern>https://www.518c

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值