爬虫
文章平均质量分 57
thorn5918
这个作者很懒,什么都没留下…
展开
-
微信公众号历史数据采集和推文监控
微信公众号历史数据采集和推文监控前因用现成的思路、代码和工具我的思路成果展示输入_biz自动跳转并自动关注,如下:采集列表结果,结果如下:!![](https://img-blog.csdnimg.cn/20210226131210163.gif)监控推文,结果如下:![](https://img-blog.csdnimg.cn/20210226131348958.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,tex原创 2021-02-26 13:17:13 · 1584 阅读 · 2 评论 -
一个转为爬虫设计的浏览器,修改chromnium代码,无视画布指纹追踪,webrtc泄露IP,支持selenium驱动,删除webdriver属性,修改event的isTrusted属性
闲言碎语做爬虫的都知道canvs、font、webgl等指纹,我个人感觉【代码1】这些除了canvs、font、webgl之外没啥大用,同样安装谷歌浏览器的,你有我也有,厂商无法当作指纹唯一的标准。前几天遇到携程这种的,连续获取你几遍画布指纹,发现收集一次你变一次,那就给你假的酒店价格,而同样的套路某数就没有(瑞数的大哥可以采纳下)。除了指纹,我发现是鼠标键盘输入等事件在评分环节占比超级高,那么除了扣JS、pyppetter之外的方案(自动化、rpc等),就要考虑click里的属性isTrusted。这个优原创 2020-12-07 10:40:18 · 4465 阅读 · 16 评论 -
不用逆向,自动生成HM4hUBT0dDOn80T,附带源码!
不用逆向,自动生成HM4hUBT0dDOn80T,附带源码!声明引言指纹源代码及hook工作canvas指纹干扰声明本文只作学习研究,禁止用于非法用途,否则后果自负,如有侵权,请告知删除,谢谢!本篇文章是一个付费文章,完整版请移步公众号:“编码天空”引言文书网自从去年上瑞数之后,我就离职了。笔者试过利用手扣JS、扫瑞树后台、miniblink浏览器直接修改指纹、c#的cef、套路对方销售拿到部署软件的方法来达到目的,但这种方法成本也挺高的,领导给你时间,客户可不给你时间。且人家8-12点上线A版原创 2020-07-15 19:00:08 · 200861 阅读 · 8 评论 -
R数通杀思路分享-反部分混淆解析canvas和fonts指纹
R数通杀思路分享-反部分混淆解析canvas和fonts指纹为啥写这篇拿到源码找到Eval看eval出的代码初步还原为啥写这篇前几天瑞数获取到我的ip了,因为我忽略了webrtc。本文会对瑞数JS进行部分还原(没有控制流)。拿到源码直接从网页上拿到html和c3aqs9gktfr4.dfe1675.js,放到Hbuilder中,格式化长这个样子,切记不要删除任何东西(css和js)。搞完图片如下。找到Eval先别研究流程直接找到eval处,至于怎么找,你可以用rockswang大哥写的hook原创 2020-06-06 08:02:23 · 5834 阅读 · 2 评论 -
JS混淆系列,瑞数(一)
每周一更针对于瑞数吃下了很多政府网站,爬虫之路越来越难走。特开此系列记录自己的破解流程,给自己两个月的时间去搞它。本次研究对象4QbVtADbnLVIc/d.FxJzG50F.cd477cf.js,希望能成功。2019.11.5由于加密Js代码每次请求变量名都不一样,在线分析会很不方便,所以需要将文件离线下载到本地,再进行分析。准备工具,fiddler、hubuilder。基础调试周六日...原创 2019-11-05 13:41:44 · 19550 阅读 · 31 评论