scrapy抓取知乎话题v0.2(实现qq发送邮件功能)

源码下载地址:http://download.csdn.net/detail/wxq714586001/8878103

一共由两个scrapy工程实现。

第一个工程zhihu_topic:实现抓取关注人数超过2000的知乎话题、相应链接、父子话题并存入MySQL数据库。这个工程只要执行一次,第二个工程会利用这里获取到的链接(link_id)。

usage:

    scrapy crawl topic

下面是从数据库中获取一部分话题的截图



第二个工程zhihu:

先贴出配置文件


topic表示抓取的话题,确保和数据库中保存的名字一致。

pages表示抓取的页数的位数,例如1表示抓取(1~9)页,2表示抓取(1-99)页。

zan_th表示赞数的最低阈值,超过这个阈值的回答才会被抓取下来。

day表示发送邮件时,最近300天内的回答才会被发送。

zan表示发送邮件时,超过100个赞的回答才会被发送。

receiver表示接受者的qq邮箱。


usage:

scrapy crawl zhihu


效果图



注意:

     在抓取完成后会立即自动发送邮件。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值