软件介绍
孔网寻书软件, 具有多种采集模式全部整合在一个软件中
具体功能如下:
1. ISBN已售销量采集 - 需cookie
2. ISBN在售价格采集
3. 孔网分类链接采集ISBN - 需cookie
4. 店铺链接采集ISBN
5. ISBN书目信息采集 - 需cookie
需cookie是因为,这些功能必须孔网登录后才能进入,所以需要登录后的账号cookie去支撑采集
不过当前已有解决方法,软件对接了cookie池,可以实现大批量稳定的持续性采集信息
整个软件的开发语言为python开发,所有采集功能使用了python最快的异步请求策略,
所以采集速度方面是极快的,唯一需要注意的是ip代理必须能够支撑起并发需求。
功能介绍
一、ISBN采集已售销量
功能页面:
小规模测试直接填入isbn即可,如果需要大规模采集的话,必须上传文件,
这样做的目的是防止数据量过大,导致软件解析卡死
填了isbn就不需要上传文件了,程序会自动判断,上传文件跟填写isbn只选其一即可
隧道代理是必填项,因为这个功能涉及到了cookie,如果不加代理裸跑cookie的话很容易导致账号被封。采集后的信息会自动保存到当前目录下info文件夹。
运行结果:
二、ISBN在售价格采集
功能页面:
这个具体需要注意的就是数量区间,选择要采集前几个商品的数量
运行结果:
三、孔网分类链接采集ISBN
功能页面:
这次是需要填写分类链接,
链接打开后应该类似这种页面
运行结果:
四、店铺链接采集ISBN
功能页面:
此功能需要填入链接, 并且自己可以选择是否等待店铺更新
运行结果:
isbn为空的原因为那本书籍为个人上传的旧书等,没有isbn
五、ISBN书目信息采集
功能页面:
运行结果: