织梦dedecms 采集笔记

本文详细介绍了如何在织梦dedecms系统中进行文章采集,从新建采集节点、设置列表网址获取规则、文章网址匹配规则,到内容字段获取规则和过滤规则,一步步教你完成整个采集过程。
摘要由CSDN通过智能技术生成

首先我们打开织梦网后台点击: 采集——采集节点管理——增加新节点
在这里插入图片描述
这里我们以采集“普通文章”为例,我们选择:普通文章,然后确定
在这里插入图片描述
我们进入了采集的设置页面,填写:节点名称,就是给这个新节点取个名字,这里你可以任意填写。(一般是:采集网站名—节点名称)
然后打开你想要采集的文章列表页,这里我们以“中国青年网”官网为例
http://renwu.youth.cn/qncyz/ 打开这个页面“创业人物”列表,右键——查看源文件找到目标页面编码,就在charset后面
或者操作点击鼠标右键—编码----查看: ● GB2312 UTF-8 其他
在这里插入图片描述
“节点基本信息”填完了,其他的一般就不用管了,如图
在这里插入图片描述
现在我们来填写“列表网址获取规则”看看文章列表第一页的地址

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值