Dedecms的采集功能虽然不如一些专业软件,但其实也还不错的。当然也有不少新手朋友可能还摸不着头绪,这里,我给大家示范一下最基本的采集功能。
这里我们以采集http://www.dedecms.com/web-art/htmlbase/HTML/list_33_1.html
官方的一个文章列表为例
首先来到后台
一,进入dedecms后台,进入 采集节点管理,新建一个节点,模型我们就选择 文章模型
二,填写节点的信息:
名称就随便 ,编码要选对,不然采集会出现乱码,来源随便,其他默认
防盗链先不管他
三.列表填写
注意几个地方 我们要采的是
http://www.dedecms.com/web-art/htmlbase/HTML/list_33_1.html
而看看同类的其他列表
http://www.dedecms.com/web-art/htmlbase/HTML/list_33_2.html
http://www.dedecms.com/web-art/htmlbase/HTML/list_33_3.html
看出规律了没有呢?从1到3
很好,这样设http://www.dedecms.com/web-art/htmlbase/HTML/list_33_[var:分页].html
四.内容规则设定
因为是演示,只要设定最简单两个就行了,标题和内容,其他的不设置也可以
当然这里获取的页面里的文章内容。根据网站和网页结构的不同,获取位置也不相同的。
所以就必须你先会看懂html代码。知道文章的内容是存放在哪里代码之间。
五、采集及导出
选择节点,点 采集 OK!
采集后点导出采集内容,选择好正确的栏目导出就行了。
小结,以上设置只是示例,有一些问题,比如,列表设置会采集到很多无关的网址,需要过滤等,这就需要进一步学习了!