新浪微博爬虫（Scrapy、Redis）环境搭建

最新推荐文章于 2024-10-08 09:47:42 发布

a931040

最新推荐文章于 2024-10-08 09:47:42 发布

阅读量1.8k

点赞数

分类专栏：数据挖掘文章标签： mongodb python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a931040/article/details/51463607

版权

本文介绍了如何搭建一个基于Scrapy和Redis的新浪微博爬虫环境。主要内容包括MongoDB的安装和启动，Python环境配置，特别是安装Scrapy及其依赖模块如pymongo、json、base64和requests。同时，需要将微博账号信息存入cookies.py文件，并调整Scrapy的设置。在Python模块安装过程中，可能会遇到版本不对应的问题，需要手动下载并安装相应版本的模块。

摘要由CSDN通过智能技术生成

Git源码地址

需要以下环境配置：
1、MongoDB安装好能启动即可，不需要配置。
2、Python需要安装好scrapy（64位的Python尽量使用64位的依赖模块）
另外用到的python模块还有：pymongo、json、base64、requests。
3、将你用来登录的微博账号和密码加入到 cookies.py 文件中，里面已经有两个账号作为格式参考了。
4、另外一些scrapy的设置（如间隔时间、日志级别、Request线程数等）可自行在setting里面调。

MongoDB的环境配置

见我的前一篇文章MongoDB环境配置

python需要的其他模块

pip下载安装的包，导致版本不对应，出现错误，需要手动下载scrapy，以及它需要依赖的包，记得选择对应的python版本。
参考文章
 pywin32
zope.interface

最低0.47元/天解锁文章

博客等级

码龄14年

16
原创

2
点赞

3
收藏

0
粉丝

关注

私信

热门文章

分类专栏

最新评论

Memory Map(Linux 存储映射IO)
CSDN-Ada助手: 非常感谢您的分享，这篇博客对于了解Linux存储映射IO的读者们肯定非常有帮助。我建议您可以继续探讨Linux内存管理相关的技术，例如基于CMA的内存分配、内存泄漏检测等方面的内容，这样的技术文章对于想要深入了解Linux内存管理的读者们会非常有吸引力。相信您的下一篇博客会更加精彩，吸引更多读者前来阅读。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。