如何采集阿里妈妈后台的淘客订单

在这里小龙只提供一个可用的方法,具体代码需要亲们自主开发,小龙开发的不便放出,请见谅!

小龙在这里使用的语言是Python,版本是3.6.3,这里使用并发写入效果比较好的mongodb来存储数据。

用到的模块:

  • selenium
  • time
  • random
  • urllib
  • json
  • pymongo
  • hashlib

阿里妈妈的登录链接为:

https://login.taobao.com/member/login.jhtml?style=minisimple&from=alimama&full_redirect=false&c_isScure=false&quicklogin=true&forward=https%3A%2F%2Fwww.alimama.com%2Findex.htm

校验登录状态的链接为:

http://pub.alimama.com/common/getUnionPubContextInfo.json

获取JSON订单的接口为:

https://pub.alimama.com/report/getTbkPaymentDetails.json?startTime=20171219&endTime=20171219&payStatus=&queryType=1&toPage=1&perPageSize=20&total=&t=1503223605295&pvid=&_tb_token_=pTK7Mfldfvq&_input_charset=utf-8

订单接口链接部分参数说明:

  • startTime:获取订单列表的开始时间
  • endTime:获取订单列表的结束时间
  • payStatus:订单状态(12:已付款,13:已取消,3:已成交)
  • toPage:第几页

程序的设计思路为,首先使用登录地址,借助seleninm进行阿里妈妈登录,然后通过校验登录状态的链接进行登录判断,判断成功后,使用订单接口进行订单数据获取,获取到的数据为JSON格式,使用Python进行循环插入到数据库就可以了。

至于翻页问题,可以在获取到数据后进行数据数量判断,如果数量为20,则Page加1,继续执行此函数就可以了。

注意:在登录及获取数据的时候,一定要加一定时间的延迟,以避免阿里妈妈进行IP封禁。

如果有疑问,欢迎入群一起交流:611836627

转载于:https://my.oschina.net/devqianlong/blog/1592239

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值