教大家怎么采集火车头 简单有效 谨记 几个要点则可

针对一些工作上 生活上 技巧上 比较费劲 费时 又找不到人来解决 辛辛苦苦花了很久时间好不容易解决好了,下次又忘记了 或者有前车之鉴 那么其他人就能站在你的肩膀上 少走弯路 节省时间了。

下面示例一番:

1, 火车头采集软件 是比较流行的 网络资源采集器 但是太过复杂 官方上的说明也是比较费劲 如果是一个新手 很难能够短时间内熟悉的。

如果要去问别人 也是爱问不答 希望越大失望越大 自己又一时半会或者没那么多时间去摸索。别人就是知道了 也不会认真的告诉你 更加不会站在

新手不懂的人基础上告知你。真所谓缺乏开成薄公之道。 其他问题也会类似 慢慢放上来 开成薄公

为此群主站在简单思维的基础上 摸索了一些小技巧 小方法 可以快速让新手入门 完成任务:

1.标签一定要与 测试那里的一模一样

假如一个网站的规则标签和发布标签如下 那么规则上一定要跟它一模一样才行否则就是测试通过了 也是没办法发布到网站上

标题

内容

原作者

来源网址

信息来源

跳转链接

发布时间

文章摘要

2添加

http标签过滤

链接

段落

去首位空白字符

3添加替换<style>(*)</style>为空

4,添加替换<img src="[参数]">为【img】[参数1]【/img】

不能有空格

<img border=1 name=MM alt= src="[参数]">

【img】[参数1]【/img】

针对腾讯新闻图片格式  其他网站看具体源码格式在做修改 如潇湘生活网的图片显示规则是那么<img border=1 name=MM alt=[参数] src=" alt="" />

下面的也替换

<img alt="[参数]" src="[参数]">

【img】[参数1]【/img】

5,取消

勾选将相对地址不全 勾选下载图片

腾讯规则:

<P style="TEXT-INDENT: 2em">(*)</p> 替换为空

///潇湘生活网通用规则 因为编辑器自定义标识引起的一些问题

<p>[参数]</p>  替换为

【b】[参数1]【/b】
增加换行功能

<strong>[参数]</stong> 替换为【b】 [参数1]【/b】 增加加粗功能

这是简单有效的采集办法比较复杂 麻烦的那就自己去慢慢研究吧 本人是没那么多咸鱼功夫 能采集到一般的新闻数据就已经相当不错 减少了 大量的工作量了

转载于:https://my.oschina.net/maphc/blog/79317

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值