spider php 采集,长腿蜘蛛 WP-CTspider 自动采集发布插件及配置教程

WordPress自动采集发布插件CTspider插件可以采集来自于任何网站的内容并全自动更新你的WordPress站点。最新WP-CTspider插件版本提高插件的兼容性,和抓取速度,最新版本不在兼容PHP7.0以下环境,它使用非常简单,无需复杂设置,并且足够强大和稳定,支持wordpress所有特性。全自动采集更新无需人工干预,只需几分钟,便可以立即更新到网站,完全自动。多线程任务执行,多线程,多任务同时执行,每个任务互不干扰,提高了近40%的执行速度。CSS选择器精确采集,只需要简单设置规则便可以精确采集标题,正文及其他任何HTML内容。

WP-CT-Spider-0.png

WP-Auto-Spider.png

支持WordPress全功能,完美支持WordPress各种功能、标签,摘要,特色图片,自定义栏目等。定时自动采集,只需要设置好每个任务,要多久执行一次任务,便可以定时执行采集任务。支持各种语言伪原创,支持百度翻译引擎(完全免费),共支持29种语言相互翻译,轻松获取原创文章,SEO,支持SEO全功能优化,支持内容过滤,甚至可以在文章任意位置添加上自定义内容,也可以自定义文章样式。附件下载,支持多种格式附件下载,包括自定义采集缩略图,并且可以选择图片添加水印。

一、如何新建一个采集任务?

1、首先打开插件,选择第一个选项:CT Spider,然后点击新建任务然后输入采集名称点击提交后,新的采集任务就已经创建完成了。

WP-CT-Spider-1.png

二、如何设置文章列表采集?

1、首先点击刚才新建的采集任务进行设置。

2、第一项一般不用设置,如果设置的话一般只设置字符编码和随机IP就好。

3、进入采集设置,输入你要采集的网址

关于怎么获取 文章网址 css 选择器:

1、首先进入列表页,右键鼠标,检查元素/审查元素 ,找到列表页文章的标签, 然后选中文章的上一个div ,看看当前div是否选中了全部的文章,记住class样式或者id样式,打开其中一篇文章的标签,找到标题所在的 a 标签的位置,如下图:

WP-CT-Spider-4.png

WP-CT-Spider-5.png

2、然后从外到内依次填入css样式选择器中,中间用空格分开。

3、然后点击测试,就可以看到采集到的文章列表。

WP-CT-Spider-6.png

三、如何设置文章内容采集?

1、点击其中一篇文章进入详情页面,然后继续检查/审查元素。

2、跟列表页的选择器一样,找到content或list之类的选择器,选择器要包含文章的标题和内容。

WP-CT-Spider-7.png

WP-CT-Spider-8.png

3、然后找到标题的选择器,以及正文的选择器:

WP-CT-Spider-9.png

5、点击测试抓取,就可以看到被抓取的文章了

WP-CT-Spider-10.png

四、如何设置发布采集的文章?

发布文章就相对简单了,选择需要发布的文章分类 > 选择发布状态 > 选择是否保存图片 即可,其他选项可以默认或者根据自己的需求调整即可!

五、如何过滤采集的数据?

过滤数据的定义:如果采集的文章中有不合适的数据,如文章的导航,广告等,就可以将其过滤掉,使用方法和采集设置一样,获取到需要过滤的数据的css样式,填入即可。

六、如何替换采集的数据?

替换数据的定义:如果采集的数据中有原作者的版权信息、昵称等数据时,就可以使用替换功能,将其替换成你的即可

七、如何使用自定义文章样式?

WP-CT-Spider-11.png

可以给任意HTML元素增加 class 或 style 属性

例如 style属性演示 : 让

标签文本变成红色:

[HTML标签 或 CSS选择器]:p 索引:0 属性:style 值:color:red;

例如 class属性演示 : WordPress自带图片居中class属性 让 标签 图片居中:

[HTML标签 或 CSS选择器]:img 索引:0 属性:class 值:aligncenter

PS: 如果 索引 是 0 为找到所有匹配的元素; 1 为找到第1个匹配的元素; -1 为找到最后1个匹配的元素

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值