scrapy抓取知乎话题v0.2(实现qq发送邮件功能)

最新推荐文章于 2023-12-19 18:59:59 发布

牧羊人Full

最新推荐文章于 2023-12-19 18:59:59 发布

阅读量2.2k

点赞数

分类专栏： python 文章标签：爬虫 scrapy mysql 数据库邮件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x_q_wang/article/details/46794449

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

源码下载地址：http://download.csdn.net/detail/wxq714586001/8878103

一共由两个scrapy工程实现。

第一个工程zhihu_topic:实现抓取关注人数超过2000的知乎话题、相应链接、父子话题并存入MySQL数据库。这个工程只要执行一次，第二个工程会利用这里获取到的链接(link_id)。

usage:

scrapy crawl topic

下面是从数据库中获取一部分话题的截图

第二个工程zhihu：

先贴出配置文件

topic表示抓取的话题，确保和数据库中保存的名字一致。

pages表示抓取的页数的位数，例如1表示抓取(1~9)页，2表示抓取(1-99)页。

zan_th表示赞数的最低阈值，超过这个阈值的回答才会被抓取下来。

day表示发送邮件时，最近300天内的回答才会被发送。

zan表示发送邮件时，超过100个赞的回答才会被发送。

receiver表示接受者的qq邮箱。

usage:

scrapy crawl zhihu

效果图

注意：

在抓取完成后会立即自动发送邮件。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy抓取知乎话题v0.2(实现qq发送邮件功能)

源码下载地址：一共由两个scrapy工程实现。第一个工程zhihu_topic:实现抓取关注人数超过2000的知乎话题、相应链接、父子话题并存入MySQL数据库。这个工程只要执行一次，第二个工程会利用这里获取到的链接(link_id)。usage: scrapy crawl topic下面是从数据库中获取一部分话题的截图第二个工程zhihu：先贴出
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。