采集规则七：河溪小说网 www.518cqdl.com 适用于-易读系统小说站河溪小说网的采集规则

最新推荐文章于 2021-04-29 19:45:26 发布

a8849516

最新推荐文章于 2021-04-29 19:45:26 发布

阅读量828

点赞数

本文链接：https://blog.csdn.net/a8849516/article/details/103205964

版权

有朋友说不会替换和查找过滤，那我就一个一个站弄下吧。没多少时间，一天发一个吧，这次是雯雯文学。

首先要过滤掉他网站的广告。过滤信息在 <PubContentText>这。可以参考下。也许还有我不知道的广告，你们可以进他的网站内页多点一下找一下看看。www.518cqdl.com

这个规则易读的采集器是可以适应的。关关不知道是否可以用。

<?xml version="1.0" encoding="UTF-8"?>
<RuleConfigInfo xmlns:xsi="https://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="https://www.w3.org/2001/XMLSchema">
<NovelIntro>
<RegexName>NovelIntro</RegexName>
<Pattern><meta property="og:description" content="((.|\n)*?)"/></Pattern>
<Method/>
<FilterPattern/>
<Options/>
</NovelIntro>
<PubContentText>
<RegexName>PubContentText</RegexName>
<Pattern><div id="content">((.|\n)*?)</div></Pattern>
<Method/>
<FilterPattern>河溪小说
手机站-m.518cqd.com
www.518cqdL.com
m.518cqdL.com
<script.+?</script>|<div.+?>|</div>|<p>|</p>
【<b>(.|\n)*?</B>】♂</FilterPattern>
<Options/>
</PubContentText>
<NovelSearchUrl>
<RegexName>NovelSearchUrl</RegexName>
<Pattern/>
<Method/>
<FilterPattern/>
<Options/>
</NovelSearchUrl>
<NovelList_GetNovelKey>
<RegexName>NovelList_GetNovelKey</RegexName>
<Pattern><span class="s2"><a href="/info/.+?/(.+?).html">.+?</a></Pattern>

<Method/>
<FilterPattern/>
<Options/>
</NovelList_GetNovelKey>
<NovelListUrl>
<RegexName>NovelListUrl</RegexName>
<Pattern>https://www.518c

最低0.47元/天解锁文章

a8849516

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
采集规则七：河溪小说网 www.518cqdl.com 适用于-易读系统小说站河溪小说网的采集规则

有朋友说不会替换和查找过滤，那我就一个一个站弄下吧。没多少时间，一天发一个吧，这次是雯雯文学。首先要过滤掉他网站的广告。过滤信息在<PubContentText>这。可以参考下。也许还有我不知道的广告，你们可以进他的网站内页多点一下找一下看看。www.518cqdl.com这个规则易读的采集器是可以适应的。关关不知道是否可以用。<?xml version="...
复制链接

扫一扫