- 博客(10)
- 收藏
- 关注
原创 淘宝sku库存(sku库存200)采集
最近发现淘宝系接口内的sku库存值有变动。通过查验APP和Web,之前在客户端显示具体库存的文案,已经从“库存:51612件”,变为“库存:有货”。找到规律:sku库存>=200的,统一显示200sku库存<200的,显示正常库存这就很麻烦了,在公司当前的业务中,如果采集的sku库存无变动,就无法计算出sku的销量,会极大影响到商品spu的销售额计算。通过一段时间的攻关,目前已解决sku库存的采集问题。破解需要注意的几个核心的点,列一下。正常的接口需带上特定的几个参数请求头
2022-04-29 14:00:11 1681 5
原创 2014款macbookpro 15-inch 升级硬盘
最近给家里的老MacBook做了个硬盘升级,这里做个记录。1、升级前的准备1)确认自己的MacBook生产年代&型号13-17款的air和pro基本都可以支持硬盘插拔(18款&之后的基本都是焊死在主板)。2)购买NVME硬盘PCIE 3.0 x4 的硬盘足矣,无所谓品牌。3)购买NVME硬盘转接头因为苹果的硬盘接口不是标准的PCIE,所以需要转换头才能插上主板。推荐购买链接:https://detail.tmall.com/item.htm?id=631924720504&a
2022-02-26 23:21:00 3598 2
原创 抖音采集攻克(XGorgon)
1、前言这段时间一直在攻关小红书和抖音的数据源,忙得有点累。好在抖音的方案已经部署到生产线上,从最近1周的采集(日请求量在1.5-2百万)来看,方案还是很稳定的。期望国庆期间不要崩了,不然只能一边工作一边休假了。2、破解思路(待定…)资料...
2021-09-28 15:49:09 746
原创 淘宝验证码破解
最近这段时间,对淘宝验证码做了一次攻关,现在把攻关的一些思路跟大家分享。1、触发验证码要攻关,首先就要能够自发&可控的触发验证码,不然连调试的对象都没有。知道如果触发之后,可以本地做个web服务,对外提供获取验证码的接口。2、滑动验证码处理淘宝的验证码是霸下团队开发的,网上搜到一些信息,但并不多,还算比较神秘。验证码的生成基于几个重要参数:浏览器指纹x5secdataNCTOKENSTRNCAPPKEY浏览器指纹用于标识客户端的唯一性。在调试过程中会发现,在某个浏览器下做
2021-07-28 11:20:42 20314 17
原创 拼多多采集2
2021.06.30拼多多啥情况这是,许久不弄,升级那么变态了。弄了几天,试了下新的方案,效果一般般。在无账号登录的情况下,单个IP只能支撑150-300左右的采集量。
2021-06-30 20:30:53 1814 20
原创 药监局数据的一些采集思路(2)
注:此方案适用于药监局所有使用了瑞数反爬的方案的站点最近几日对瑞数的脚本做了研究,弄了个更优雅的破解方案。1、首先对脚本进行逆向分析,对加签部分进行hook处理。2、chrome插件注入脚本js (包含websocket代码处理)3、本地启动websocket服务(本人使用flask+flask_socketio)就那么简单3步即可在本地拥有接口加签服务...
2021-06-22 12:04:31 1847 7
原创 药监局国产非特备案数据的一些采集思路
前言最近公司相关业务变动,需要采集药监的一些数据。在经过一段的时间的摸索后,顺利完成了需求。在这里,我会简单的分享个人在采集过程中的一些思考,如果能帮到大家就非常好了。采集需求采集地址:http://ftba.nmpa.gov.cn:8181/ftban/fw.jsp采集数据项:非特备案产品的所有数据(列表&详情数据)采集数量:?采集分析首先我们打开网址:http://ftba.nmpa.gov.cn:8181/ftban/fw.jsp 对数据进行分析f12打开chrome调试控制
2021-06-03 16:48:39 2683 6
原创 拼多多数据采集
千辛万苦,总算把新的拼多多采集方案弄出来了,回想起几个月的尝试和摸索,真心觉得不容易。前期尝试的方案包括但不限于:1、H5,PDDAccessToken+anticontent这个方案很明显,需要处理两个问题:1)账号问题你采集的量越大,需要的账号数就越多。因为采集到一定的数量,拼多多会对你的账号进行标记,标记之后,会进行投毒或验证码拦截。2)anticontent参数破解网络上有很多文章详细聊到,这里就不赘述了。方案最后还是被我放弃了,因为要满足公司的业务需求,需要用到太
2020-09-21 23:41:01 13137 65
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人