爬虫
文章平均质量分 79
天下无虫
这个作者很懒,什么都没留下…
展开
-
acw_sc__v2的算法破解之路
前言本文仅供学习参考,如有侵权,请私信删除由于版权问题,本文所展示的代码并非完整代码,也不提供相关工具,关键参数只提供思路。提示不知道该加密算法源自何处,但发现有不少网站均使用了该加密算法该算法为固定算法,计算过程为固定不变的,将动态变量“arg1”代入算法中即可得到结果(也就是acw_sc__v2的Cookie值)过程案例源码(为方便看清,已做格式化处理)<html><script>var arg1 = 'ADA924E58A5ECA50A88727F原创 2021-05-11 18:45:13 · 2875 阅读 · 9 评论 -
浅谈去哪儿算法,搜索结果打乱,_m_参数,headers,pre关键参数等
前言本文仅供学习参考,如有侵权,请私信删除由于版权问题,本文所展示的代码并非完整代码,也不提供相关工具,关键参数只提供思路。登录登录的请求如下:https://user.qunar.com/mobile/doLogin.jsp请求参数:ret: https://pay.qunar.com/mobile/h5/personalcenter/myaccount/index.htmusername: 18888888888password: 123456vcode: remember: 1原创 2021-01-07 21:21:41 · 2766 阅读 · 3 评论 -
某站的DESC加密算法及dx算法
加密参数如图:desc: coBPtm4BZy5Ly7E1arnlj2vpMZNyrN/1%2BLDoZV95IdUg4tn6MrBJX4I6VhmHGTkY该值就是加密后的参数,经过分析发现该参数实际调用的getParams方法进行生成。getParams方法是加密的入口方法,深入下去,发现是DES加密算法。部分加密算法代码:function getParams() { var e = { xy: mcArrs, fingerprint: (new re原创 2020-11-24 16:56:38 · 868 阅读 · 1 评论 -
eTerm 3in1.exe 黑屏三合一插件TCP算法
先抓包,看加密抓包发现请求数据为:<Statement><Info1>xxxxxxxxxxx数字</Info1><Info2>A5D6AF7A66CC12FFA329C1645677CFE26A62585C387FFBFF125C1FED6F817157BD479CE5CE362DA91CA81A0A2F7B29B827CF3E05FA233C4DDT56R88A36DD193F</Info2></Statement>完整内容传送门原创 2020-09-23 18:26:06 · 1017 阅读 · 3 评论 -
去哪儿APP 算法初探窥镜
初探拿到APP后,首先就是抓个包看看,到底有哪些参数。结果啥参数也没有,所有请求全部加密~如图所示!根据抓包,可以发现请求URL格式为:https://slugger.qunar.com/slugger-proxy+服务接口名称,并且POST数据均加密,将POST数据强转为字符串发现前面均为a1907开头。代码分析定位以截图的请求为例:https://slugger.qunar.com/slugger-proxy?qrt=f_flight_rn_domestic_flightlist,请求中的接原创 2020-09-23 17:15:54 · 1511 阅读 · 2 评论 -
关于捷星的反爬虫及sensor_data参数的心得分享
啃过很多难啃的骨头,没想到居然还有这么难啃的骨头。研究了这网站许久,换了无数种思路,都失败而终。下面就将把我踩过的坑,一一道来。花了几天,把JS全部读完,将所有方法全部翻译。JS里面,有效验鼠标轨迹点击事件的方法,有检测Selenium等自动化工具的方法,有检测无头浏览器的方法,有效验浏览器内核与UA信息是否匹配的方法(通过浏览器JS支持的特有属性方法检测),有获取浏览器指纹的方法...原创 2020-03-06 23:23:09 · 4042 阅读 · 16 评论 -
WOFF字体反爬之易车网
前言易车网链接:http://dianping.bitauto.com/sid_2384/koubei/2557927641943680该页面评价加载了WOFF字体,在审核元素中查看,发现个别汉字无法正常显示,由此可推测该WOFF文件中,只有少数常用汉字被单独编码了。审核元素中无法正常显示的字,在源码中显示为“”格式,该格式为unicode编码。正文字体文件下载地址:htt...原创 2019-12-25 10:29:32 · 801 阅读 · 0 评论 -
WOFF字体反爬之58同城
首先,打开页面,了解到这部分信息是有字体加密的。如下图:这部分信息包含 性别 年龄 学历 还有工作经验。 这部分信息需要经过转换,才能达到我们想要的数据。可以看到它数据加密部分,都引用了一个叫stonefont的class,我们观察一下这个class经过观察发现 这里引用了woff的一个字体文件, 我们把其中的base64编码部分提取出来,保存为一个.woff的文件。python代码示...转载 2019-12-25 10:26:36 · 2392 阅读 · 0 评论