最新版火车头织梦内容发布规则_最详细火车头数据采集系统DedeCMS发布文章攻略...

搜索引擎不喜欢复制的东西更不喜欢数据采集,但有时候遇到一些情况,比如网站由于改版、换数据库、换管理程序等,需要把网络数据采集或网站备份。提醒各位:

①做任何操作之前一定要备份数据库并打包原站;

②对排名较好的网站不建议对网站

③对新站不建议采集别人网站的信息,会降低新站特殊权重给分。

前段时间做一个老网站的改版方案,由于

网站基本情况

这个站原来有排名,收录量也比较多,优化也比较好,制作风格和吖七很相似,代码简洁,前端大气,标签运用还可以,只是网站优化方法带点黑帽。用的asp程序后台,数据库是access,要换成php,数据库是my

网站改版用的软件工具-

网站借助火车头采集改版详细步骤

1.本地环境搭建、安装DedeCMS、安装Fiddler Web抓包工具、安装火车头采集7.6等软件

安装方法很简单,相关文章《本地安装PHP环境 测试织梦CMS》,《如何安装dedecms织梦详解》。

提供部分软件下载链接:http://pan.baidu.com/s/1qXSaMOs 密码:3n7e

2.火车头设置(重点内容)

官方说明较简单,新手采集网站数据一定要多看多实践。打开火车头采集工具,新建一个任务和分组。

第一步:采集网址规则

①起始地址。即提取分页规则,按照下图依次:点击添加-点击批量/多页-输入地址格式,比如我要采集的地址列表有,即是:http://www.123.com/case.asp?page=1&SmallClass=1 http://www.123.com/case.asp?page=2&SmallClass=1 http://www.123.com/case.asp?page=3&SmallClass=1

看得出变量是1,2,3...采用通配符写法就是http://www.123.com/case.asp?page=(*)&SmallClass=1

选择等差数列的项数为所要采集的列表数量,根据实际情况写。依次点击添加

再依次点击添加-完成-关闭。

②多级网址获取。 即获取某个分页的URL地址列表。在任意一个目标列表中,鼠标右键-查看源代码,一般来说有基础的同学就不必多说了,实在不懂的网上资源也多。找到特征代码片段,按下图写好,保存即可。

点击测试网址采集,确保列表采集规则正确后,进行第二步。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值