python通过adb连接爬取支付宝移动端的账单信息,操作过程如下:
于是此文件就可以分解为如下四个主要功能:
1.图片识别;2.模拟点击;3.模拟滑动;4.截图功能
一.对账单详情页的处理:
对账单详情页截图后,再选择用图片分割,捕捉到3个截图,分别是:名称字段,账单数额字段;账单编号字段;
二.对账单缩略页的处理:
如何处理账单的缩略页,开始时自己是想,传入一个基准,然后每次向下遍历一个等额的数值进行点击,获取详情页的数据,但是这样的话,每次只能获取一页,而且对遍历的条件无法得知,于是自己就选择了读完一条数据就向下滚动的方法,进行遍历每一条的账单;
三.对每月账单的筛选:
当自己选择读完一条数据向下滚动时,此时加上一个判断条件,即如果接下来截图并且分割好的图片中如果含有'月'或者'目'的字段时,就将其判别为当月结束,跳出循环,否则向下滚动,并且模拟点击;
# -*- coding: utf-8 -*-
import os
import math
import matplotlib.pyplot as plt
import pytesseract
from PIL import Image
import time
import csv
import numpy as np
import matplotlib.image as mpimg</