首先我们打开织梦网后台点击: 采集——采集节点管理——增加新节点
这里我们以采集“普通文章”为例,我们选择:普通文章,然后确定
我们进入了采集的设置页面,填写:节点名称,就是给这个新节点取个名字,这里你可以任意填写。(一般是:采集网站名—节点名称)
然后打开你想要采集的文章列表页,这里我们以“中国青年网”官网为例
http://renwu.youth.cn/qncyz/ 打开这个页面“创业人物”列表,右键——查看源文件找到目标页面编码,就在charset后面
或者操作点击鼠标右键—编码----查看: ● GB2312 UTF-8 其他
“节点基本信息”填完了,其他的一般就不用管了,如图
现在我们来填写“列表网址获取规则”看看文章列表第一页的地址
织梦dedecms 采集笔记
最新推荐文章于 2021-09-20 09:01:26 发布
本文详细介绍了如何在织梦dedecms系统中进行文章采集,从新建采集节点、设置列表网址获取规则、文章网址匹配规则,到内容字段获取规则和过滤规则,一步步教你完成整个采集过程。
摘要由CSDN通过智能技术生成