Python模拟登陆淘宝并统计淘宝消费情况的代码实例分享

最新推荐文章于 2021-01-11 17:15:15 发布

你曾路过我的故乡

最新推荐文章于 2021-01-11 17:15:15 发布

阅读量1.4k

点赞数 3

分类专栏： Python 文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_45038034/article/details/90375851

版权

本文分享了一段Python脚本，用于模拟登录淘宝并统计特定时间段内的消费情况。通过解析‘已买到的宝贝’页面，获取订单和宝贝详情，帮助用户了解在淘宝上的支出。需要BeautifulSoup4库支持。

摘要由CSDN通过智能技术生成

支付宝十年账单上的数字有点吓人，但它统计的项目太多，只是想看看到底单纯在淘宝上支出了多少，于是写了段脚本，统计任意时间段淘宝订单的消费情况，看那结果其实在淘宝上我还是相当节约的说。
脚本的主要工作是模拟了浏览器登录，解析“已买到的宝贝”页面以获得指定的订单及宝贝信息。
在这里插入图片描述

用方法见代码或执行命令加参数-h，另外需要BeautifulSoup4支持，BeautifulSoup的官方项目列表页：https://www.crummy.com/software/BeautifulSoup/bs4/download/
首先来说一下代码使用方法:

python taobao.py -u USERNAME -p PASSWORD -s START-DATE -e END-DATE --verbose

所有参数均可选，如:

python taobao.py -u jinnlynn

统计用户jinnlynn所有订单的情况

python taobao.py -s 2014-12-12 -e 2014-12-12

统计用户(用户名在命令执行时会要求输入)在2014-12-12当天的订单情况

python taobao.py --verbose

这样就可以统计并输出订单明细。
好了，说了这么多我们就来看代码吧：

from __future__ import unicode_literals, print_function, absolute_import, division
import urllib
import urllib2
import urlparse
import cookielib
import re
import sys
import os
import json
import subprocess
import argparse
import platform
from getpass import getpass
from datetime import datetime
from pprint import pprint
try:
 from bs4 import BeautifulSoup
except ImportError:
 sys.exit('BeautifulSoup4 missing.')
__version__ = '1.0.0'
__author__ = 'JinnLynn'
__copyright__ = 'Copyright (c) 2014 JinnLynn'
__license__ = 'The MIT License'
HEADERS = {
 'x-requestted-with' : 'XMLHttpRequest',
 'Accept-Language' : 'zh-cn',
 'Accept-Encoding' : 'gzip, deflate',
 'ContentType' : 'application/x-www-form-urlencoded; chartset=UTF-8',
 'Cache-Control' : 'no-cache',
 'User-Agent' :'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.38 Safari/537.36',
 'Connection' : 'Keep-Alive'
}
DEFAULT_POST_DATA = {
 'TPL_username' : '', #用户名
 'TPL_password' : '', #密码
 'TPL_checkcode' : '',
 'need_check_code' : 'false',
 'callback' : '0', # 有值返回JSON
}
# 无效订单状态
INVALID_ORDER_STATES = [
 'CREATE_CLOSED_OF_TAOBAO', # 取消
 'TRADE_CLOSED', # 订单关闭
]
LOGIN_URL = 'https://login.taobao.com/member/login.jhtml'
RAW_IMPUT_ENCODING = 'gbk' if platform.system() == 'Windows' else 'utf-8'
def _request(url, data, method='POST'):
 if data:
   data = urllib.urlencode(data)
 if method == 'GET':
   if data:
     url = '{}?{}'.format(url, data)
   data = None
 # print(url)
 # print(data)
 req = urllib2.Request(url, data, HEADERS)
 return urllib2.urlopen(req)
def stdout_cr(msg=''):
 sys.stdout.write('\r{:10}'.format