分享一个开源项目:TSDK。地址在阅读原文里。
TSDK
淘宝爬虫SDK,用于淘宝开放平台或淘宝登录爬取
淘宝系列爬虫系列SDK
SDK更新到第二版,对一部分进行了优化
-
优化掉通用类,此类本身最开始是为了能够使用无授权API,但是之后发现臃肿繁杂,还不如直接请求网址URL,觉得有些画蛇添足了,所以直接去掉
优化开放平台类,繁杂的配置文件,多余的加载,我用了Node的SDK之后发现还不如Node的方便,只需要传入API名称和数据就行了,那么我弄了配置文件又有什么用,没有达到简单可用的目的遂改成Node一样的方式请求数据
优化H5API类,经过我思考后觉得配置文件太过繁杂,且不够灵活也不多变,爬虫本身就是需要多变的,所以移除配置文件,通过传递参数直接构建,更加灵活方便
还有部分功能未实现,例如日志功能和请求重放功能,以及新添加的网站
from TSDK.mTop import Client
top = Client()
#获取淘宝二维码,可以通过扫码登录淘宝
umid_token = top.getUmidToken()
res = top.login(umid_token)
print(res.text)
data = json.loads(res.text)
thr &#