孔夫子旧书网采集软件 - 孔网寻书

软件介绍

孔网寻书软件, 具有多种采集模式全部整合在一个软件中

具体功能如下:

1. ISBN已售销量采集 - 需cookie
2. ISBN在售价格采集
3. 孔网分类链接采集ISBN - 需cookie
4. 店铺链接采集ISBN
5. ISBN书目信息采集 - 需cookie
需cookie是因为,这些功能必须孔网登录后才能进入,所以需要登录后的账号cookie去支撑采集

不过当前已有解决方法,软件对接了cookie池,可以实现大批量稳定的持续性采集信息

整个软件的开发语言为python开发,所有采集功能使用了python最快的异步请求策略,

所以采集速度方面是极快的,唯一需要注意的是ip代理必须能够支撑起并发需求。

功能介绍

一、ISBN采集已售销量

功能页面:

小规模测试直接填入isbn即可,如果需要大规模采集的话,必须上传文件,

这样做的目的是防止数据量过大,导致软件解析卡死

填了isbn就不需要上传文件了,程序会自动判断,上传文件跟填写isbn只选其一即可

隧道代理是必填项,因为这个功能涉及到了cookie,如果不加代理裸跑cookie的话很容易导致账号被封。采集后的信息会自动保存到当前目录下info文件夹。

运行结果:


二、ISBN在售价格采集

功能页面:

这个具体需要注意的就是数量区间,选择要采集前几个商品的数量

运行结果:


三、孔网分类链接采集ISBN

功能页面:

这次是需要填写分类链接,

链接打开后应该类似这种页面

运行结果:


四、店铺链接采集ISBN

功能页面:

此功能需要填入链接, 并且自己可以选择是否等待店铺更新

运行结果:

isbn为空的原因为那本书籍为个人上传的旧书等,没有isbn


五、ISBN书目信息采集

功能页面:

运行结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值