批量抓取微信朋友圈 Java_微信朋友圈转疯了(golang写小爬虫抓取朋友圈文章)...

很多人在朋友圈里转发一些文章,标题都是什么转疯啦之类,虽然大多都也是广告啦,我觉得还蛮无聊的,但是的确是有一些文章是非常值得收藏的,比如老婆经常就会收藏一些养生和美容的文章在微信里看。

今天就突发奇想,不如利用搜索引擎把朋友圈的文章分门别类的(当然是老婆感兴趣的类型了)抓取出来,然后把图片也Down下来,生成一个网站给朋友们看岂不是不错? 说做就做,于是就有了这个网站:朋友圈转疯了 (http://www.meijia0.com) 域名不太好,凑合着用呗。(之前其实是准备用来做美甲图片站的,后来搁置了。因为老婆在家真的是没有时间去经营这种东西)。

既然说做就做,先利其器嘛, 把落灰的GO再捡起来,顺便学习了一下七牛云存储的API(不得不说真的是很受用),写了一个spider(gocrawl/goquery)。

之前有写一个笑话抓取的小东西  改了一下。增加了增量抓取(使用redis作cache),mongodb作为存储,前端嘛,万能的jquery+bootstrap,评论系统使用了多说。服务器放在阿里去,现在真是好时候,做什么东西都是齐全的。

根据关键词漫爬,24小时不停更新朋友圈文章,还有什么可以追求的呢?也许下次可以做一下中文分词和全文检索吧。

一整天,完事。其间在下载图片和加水印,以及上传至七牛这块浪费了太多时间。不管怎么说,上线了。来瞧瞧吧!

以下是代码片断:

golang给图片加水印

225_1.jpg

golang 生成缩略图

225_2.jpg

golang上传文件至七牛

225_3.jpg

今天看了一篇许志伟同学的报道,甚是佩服。

有疑问加站长微信联系(非本文作者)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值