帝国cms采集图文教程(下)

前两讲我们分别介绍了帝国cms采集基本流程和帝国cms如何采集内容分页,最后这一讲主要介绍帝国cms采集过滤与替换,还有些技巧。

一、过滤
1、帝国cms采集过滤分为两种:
(1)“整体页面过滤正则”:
1-1-1.JPG

(2)“过滤广告正则”:
1-1-2.JPG

我们有些疑惑,这两种过滤到底有什么区别?“整体页面过滤正则”是过滤整个网页的html代码。“过滤广告正则”是过滤文章内容,仅对文章内容([!--newstext--])起作用。

2、过滤实例:
过滤实例(1):
1-2-1.jpg

我们采集后发现信息内容底部多了行代码:“<div style="clear:both;height:0;visibility:hiddden;overflow:hidden;">&nbsp;</div>”,根据格式“广告开始[!--ad--]广告结束”得到“过滤广告正则
”:
1-2-2.JPG

过滤实例(2):
1-2-3.jpg

要过滤链接代码怎么办,注意“过滤广告正则”右边有堆代码:
1-2-4.jpg

鼠标先点击A,系统自动生成过滤链接代码“<a[!--ad--]>,</a>,<A[!--ad--]>,</A>”,这样就可以把采集后的内容链接过滤掉了。同理,如果想过滤其他html代码就点击相应的标签代码。
注意事项:当内容分页包含在内容([!--newstext--])里时,要过滤掉内容分页,否则会重复出现内容分页。

二、替换
1、帝国cms采集替换也分为两种:
(1)“整体页面替换”:
2-1-1.JPG

(2)“替换”:
2-1-2.JPG

他们两种区别:“整体页面替换”是替换整个网页的html代码。“替换”是替换文章标题和内容,仅对标题([!--title--])和([!--newstext--])起作用。

2、替换实例:
2-1-3.JPG
我们要把内容里的“新华网”替换成“中华网”:
2-1-4.JPG

预览下:
2-1-5.jpg
没有问题,替换过来了。

三、图片采集
(1)我们采集时会碰到信息内容可以正常采集,但是里面的图片却不显示,例子:
3-1.jpg

信息内容可以正常采集,就是图片不显示出来,这是由于内容图片的路径不对,图片的路径为相对地址。

(2)查看源代码:
3-2.jpg
图片是相对地址,要换成绝对地址才能采集成功。

(3)替换成绝对地址:
先在目标站的图片右键查看属性:
3-3-1.jpg
目标站的图片地址为“http://www.gdyd.com/news/PNews/a/e77366_634655073936250000.jpg”,我们采集所到的图片地址为“/news/PNews/a/e77366_634655073936250000.jpg”,分析得到前缀“http://www.gdyd.com”,我们把前缀放到“图片/FLASH地址前缀(内容)”,如下图:
3-3-2.JPG

(4)前台预览图片:
图片显示出来了:
3-4-1.JPG

查看源代码:
3-4-2.JPG
图片地址没错,是本地地址。
注意事项:我们在采集预览和在本地临时入库信息时,发现已经添加了图片地址前缀了,但是图片还是不显示,出现这个你不用理他,直接入库,入库了系统才会自动添加图片地址前缀。

至此采集实例讲解完毕,这三讲对帝国cms采集的基本流程,重点,难点基本都概括了,还有些基础的功能没能一一介绍清楚,大家可以到帝国官方网站看下基础教程。
本文由 国外网站大全http://www.kguowai.com 原创,转载请注明出处,谢谢!

转载于:https://my.oschina.net/kguowai/blog/49310

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
帝国CMS使用教程 一、系统简介 (一)、系统简介 (二)、系统经历版本 (三)、系统主要特性 (四)、系统版本对比 (五)、系统在线演示 (六)、最新版本下载 二、系统运行环境 (一)、帝国CMS运行环境 三、安装帝国CMS (一)、开始安装系统 (二)、万能会员整合接口 (三)、安装时需要设置权限的目录 四、熟悉帝国CMS (一)、建站流程图 (二)、目录结构说明 (三)、熟悉系统菜单 五、系统入门 (一)、栏目管理 1、增加栏目 2、栏目操作 3、非终极栏目页面的两种形式 (二)、专题管理 1、增加专题 2、专题操作 3、组合专题 (三)、批量转移信息 (四)、信息管理 1、增加信息 2、编辑器菜单说明 3、信息管理 4、信息签发 5、按条件删除信息 6、统计信息数据 (五)、数据更新 (六)、评论管理 1、评论管理 2、评论过滤字符管理 (七)、图片信息管理 (八)、附件管理 (九)、批量替换信息内容 (十)、刷新任务管理 (十一)、用户自定义JS (十二)、自定义信息列表 (十三)、搜索关键字排行 (十四)、远程发布 (十五)、RSS/ATOM/XML调用 (十六)、其它说明 1、数据库参数配置文件 2、connect.php的几个配置参数 3、错误报告功能调用地址 4、整合防盗链软件说明 5、下载防盗链建议 6、如何绑定栏目的域名 7、FLASH/视频的防盗链方法 六、模板 (一)、修改首页模板 (二)、列表模板制作 (三)、内容模板制作 (四)、公共模板变量 (五)、搜索模板制作 (六)、模板标签 1、系统内置标签语法 2、万能标签使用 3、自定义标签 4、标签的导入与导出 5、其它说明 1、支持按SQL语句调用说明 2、让标签参数支持模板变量 3、标签调用记录范围小技巧 4、本月热点排行的sql标签 (七)、JS模板 (八)、投票模板 (九)、其他模板制作 1、评论列表模板 2、控制面板模板 3、高级搜索表单模板 4、搜索JS模板 5、相关信息链接模板 6、信息打印模板 7、搜索表单制作 8、登陆表单制作 9、评论表单制作 10、修改下载/在线地址模板 (十)、模板相关说明 1、开启模板支持程序代码 2、下载不采用弹出窗口式说明 3、文章内容加环饶广告 4、在内容页面直接显示评论 (十一)、自定义页面 (十二)、管理后台样式 (十三)、批量导入栏目模板 (十四)、批量更换栏目列表模板 (十五)、批量替换模板内容 七、用户与会员 (一)、用户 1、用户组 2、用户 3、更换后台风格 4、日志管理 4.1、登陆日志管理 4.2、操作日志管理 (二)、会员 1、会员组管理 2、会员管理 3、批量赠送点数 4、点卡 4.1、点卡管理 4.2、点卡充值 5、其他会员功能 5.1、权限与点数验证流程图 5.2、设下载/观看扣点间隔 5.3、推荐赠送点数语法说明 八、采集 (一)、增加采集节点 (二)、管理采集节点 (三)、采集教程 1、实例教你使用采集(4.0版) 2、视频演示如何采集 3、小林教你如何采集[图文] 4、药莲教你如何采集[解析版] 5、采集常用技巧 6、采集技巧-药莲个人经验 7、一些特殊字段正则的说明 九、系统模型 (一)、什么是系统模型? (二)、建立系统模型的流程图 (三)、建立数据表 (四)、数据表管理 1、管理数据表 2、字段管理 2.1、新建字段 2.2、管理字段 3、新建系统模型 (五)、自定义系统模型教程 1、演示制作产品展示系统 2、视频演示制作简单的MTV系统 (六)、Ecms程序扩展变量说明 十、插件 (一)、广告系统 (二)、投票 (三)、友情链接 (四)、多分类留言板 (五)、多分类信息反馈 (六)、防采集插件 (七)、会员宣传插件 十一、数据备份与恢复 (一)、数据备份 (二)、数据恢复 (三)、执行SQL语句 十二、常见问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值