针对一些工作上 生活上 技巧上 比较费劲 费时 又找不到人来解决 辛辛苦苦花了很久时间好不容易解决好了,下次又忘记了 或者有前车之鉴 那么其他人就能站在你的肩膀上 少走弯路 节省时间了。
下面示例一番:
1, 火车头采集软件 是比较流行的 网络资源采集器 但是太过复杂 官方上的说明也是比较费劲 如果是一个新手 很难能够短时间内熟悉的。
如果要去问别人 也是爱问不答 希望越大失望越大 自己又一时半会或者没那么多时间去摸索。别人就是知道了 也不会认真的告诉你 更加不会站在
新手不懂的人基础上告知你。真所谓缺乏开成薄公之道。 其他问题也会类似 慢慢放上来 开成薄公
为此群主站在简单思维的基础上 摸索了一些小技巧 小方法 可以快速让新手入门 完成任务:
1.标签一定要与 测试那里的一模一样
假如一个网站的规则标签和发布标签如下 那么规则上一定要跟它一模一样才行否则就是测试通过了 也是没办法发布到网站上
标题
内容
原作者
来源网址
信息来源
跳转链接
发布时间
文章摘要
2添加
http标签过滤
链接
段落
层
去首位空白字符
3添加替换<style>(*)</style>为空
4,添加替换<img src="[参数]">为【img】[参数1]【/img】
不能有空格
<img border=1 name=MM alt= src="[参数]">
【img】[参数1]【/img】
针对腾讯新闻图片格式 其他网站看具体源码格式在做修改 如潇湘生活网的图片显示规则是那么<img border=1 name=MM alt=[参数] src=" alt="" />
下面的也替换
<img alt="[参数]" src="[参数]">
【img】[参数1]【/img】
5,取消
勾选将相对地址不全 勾选下载图片
腾讯规则:
<P style="TEXT-INDENT: 2em">(*)</p> 替换为空
///潇湘生活网通用规则 因为编辑器自定义标识引起的一些问题
<p>[参数]</p> 替换为
<strong>[参数]</stong> 替换为【b】 [参数1]【/b】 增加加粗功能
这是简单有效的采集办法比较复杂 麻烦的那就自己去慢慢研究吧 本人是没那么多咸鱼功夫 能采集到一般的新闻数据就已经相当不错 减少了 大量的工作量了