博客聚合的想法

      做一个博客聚合的站点,而站点的聚合必须不能手工聚合,而是程序自动聚合,这样,才能在众多的聚合网站中,立于不败之地。

程序自动聚合,实际上就是网页搜索。可是考虑使用python开发。

这个只是一个想法,不知道能否实现,如果可以的话,每天可以更新成百上千的内容。

 

      博客上的内容必须被采集下来,作为自己页面的博客,然后注释上来源地址。

      另外加上论坛加精贴聚合

 

      先选择几个有特色的网站,作为内容来源。每个网站选择一个特色版块。

 

      内容采集时,可以对页面的访问量设定一定的值,如:1-20页,采集访问量n以上的页面,以后一次性采集500次以上。具体值可以先统计再采集。一般总采集量在500-1000篇文章左右。

 

 

      博客选择:

      linux: http://blog.chinaunix.net/techart.php?frmid=6&page=1

      freebsd: http://blog.chinaunix.net/techart.php?frmid=7&page=1

 

      论坛:不过论坛可以对大型技术论坛多采集几个重要版块

      linux内核:http://linux.chinaunix.net/bbs/forum-8-1.html

      linux服务器应用:http://linux.chinaunix.net/bbs/forum-3-1.html

      linux入门:http://bbs.linuxeden.com/forum-15-1.html

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值