wordpress php 采集器,wordpress 采集插件怎么用

本文详细介绍了如何安装和配置WordPress采集插件WP-JPost,包括定向采集目标网站内容、设置入库分类、自定义文章标签、内容处理等功能。通过设置抓取目标、入库目标分类ID、标签、元素选择等参数,实现自动化的网站内容抓取和发布。同时,该插件还支持脚本定时增量更新和内容翻译。按照提供的步骤,用户可以轻松添加和管理采集任务。
摘要由CSDN通过智能技术生成

0e08495c93e9b46a29207ab5f459868b.png

主要功能

(1)定向采集目标网站内容,并直接发布。

(2)可以设置对应入库的分类。

(3)可以自定义文章的标签。

(4)可以自定义替换标题、文章内容。

(5)自动另存为图片到本地。

(6)自动删除内容中的所有链接。

(7)加入百度翻译,可以将内容翻译成英文。

(8)脚本定时自动增量功能。

插件截图如下

d5438e905c167dcdb58f1ba74466723b.png

41e5e3a9ce9d0d83e0f26663a503dfec.png

aab835adc557a8be0c66e1213f30eb6a.png

如何安装WordPress采集插件WP-JPost?

方法一:在后台插件中直接搜索“wp-jpost”

b74dc06a524efec4b0b7fddf5238a26e.png

bd26149af902c603eba594e5dbc7d08c.png

方法二:在WordPress插件官网下载,然后上传安装

https://wordpress.org/plugins/wp-jpost/

如何添加采集任务?

任务名命名请使用英文字母数字组合. 例:douban。

抓取目标网站域名(网址以/结束)这里填写目标网站首页的地址,以/结束。 例:https://www.douban.com

抓取目标网站列表页列表页一般都是二级页面,是栏目的具体展示页,一般是用页内跳转的链接。 例如:https://www.douban.com/group/meituikong/

入库目标分类IDWordPress 后台 -- 文章 -- 分类目录 -- 编译你想入库到的分类 -- 查看浏览器地址栏的地址。

例:/wp-admin/term.php?taxonomy=category&tag_ID=38... 这里的tag_ID=38,这个38就是我们需要填写的值。

标签WordPress 入库时,写入文章的标签值。多个标签请使用,分割(英文状态的逗号分隔) 例:WordPress,LaoJi,wp-jpost。

目标网站a链接元素列表页中到二级目录的链接地址,同jQuery选择器方法。

分页格式列表页中第二页区别列表页的地方。例: 列表页地址:https://www.douban.com/group/meituikong/

翻页后变成:https://www.douban.com/group/meituikong/discussion?start=8850

那么这里就填写:discussion?start={page} 这里的 {page} 就是翻页变化的地方。

分页最大值这里填写翻页后最后的page值。例: http://147hub.com/page/2052 这里翻页的最大值,即填写:2052

获取单页标题、目标单页获取元素 :title

内容页中标题、内容的标签值。同jQuery选择器方法。下面我们具体得讲述一下怎么选择元素。

首先我们需要使用chrome、firefox之类的浏览器。这些浏览器都具有调试等功能。我们这里以Firefox为例。

首先分析代码,以下元素标签可以是div , h3 ,title ,span , p 等。 例:...元素标签>,那么我们应该则填入:元素标签.classname。 例:...元素标签>,那么我们应该则填入:元素标签#classname。

步骤:

1、网页空白处右击 -- 查看元素 。 下面会弹出一个调试器出来。

625b2262f03982792f5ad959e7ef2c7d.png

内容搜索值 、内容替换值(可以批量多个替换)

比如标题正文中带有一些原来的字符串,我想替换成我的,或者不要了。 注意:这里如想替换成一样的值,可以直接写一个。如每个替换成不同的则需要对应填。

例:

搜索值:- 摔角资料, - 赛事新闻 - 摔角网, - 赛事战报, - 摔角网

替换值:

搜索值:搜索1,搜索2,搜索3

替换值:替换1,替换2,替换3 注意这里要一一对应。例如搜索2去要替换成空则替换值也需要留空(替换1,,替换2),否则就不能对应替换了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值