闲鱼自动抓取/筛选/发送系统， idlefish / xianyu spider crawler sender program blablabla

最新推荐文章于 2025-01-31 11:51:50 发布

bugtraq2021

最新推荐文章于 2025-01-31 11:51:50 发布

阅读量3k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/John_Lenon/article/details/121228672

版权

爬虫数据库

xianyu-idlefish-spider-crawler-sender

1102 v 1.0.8 更新搜索入库分词优化

10-30 v 1.0.8 更新预览图片。

v 1.0.6 更新黑名单。

可以在客户端添加黑名单。

v 1.0.5 更新bug

因为闲鱼价格过万会变换显示方式，导致程序无法识别。更新价格显示方式。

v 1.0.4更次更新

为抓取程序重构代码，并升级UI

v 1.0.4更新抓取首页和数据库页面

再次更新，将原来杂乱的列表型数据显示更新为表格，这样看起来就没有那么乱了。更新下效果图：

v 1.0.3添加多终端采集

在分布式采集的基础上，再次添加同一终端上面的多线程采集，进一步提高采集效率。采集端代码在原有基础上再次升级。

v 1.0.3已经升级完毕

抓取数据目前比较快的话，可以达到10秒钟入库体现，关键词多的话，会有一定延迟。

同时，数据库从本地移到服务器，开始使用远程连接和储存数据，更方便分布式搭建、站库分离，以及一服多客模式。

更重要的是，不再需要配制本地数据库，不会再因为本地数据库问题导致程序down掉。

虽然原来也写了自动化配制数据库的程序，但因为系统权限问题，始终不太理想。这次干脆干掉本地数据库，只需要一个客户端，为所欲为了。

v 1.0.1.2升级数据库启动文件，自动检测系统数据库配制情况。

1 建议使用mongodb 4.2.14，将mongod.exe移动到bin文件中

2 运行数据库启动软件，自动建立数据库文件和日志文件。

3 运行程序

项目地址：

github: https://github.com/FightingForWhat/xianyu_spider-crawler-sender

gitee: https://gitee.com/FightingForWhat/xianyu_spider-crawler-sender

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。