某游记网_sn算法分析

最新推荐文章于 2024-05-31 17:36:25 发布

gbkhero

最新推荐文章于 2024-05-31 17:36:25 发布

阅读量93

点赞数

分类专栏：网络爬虫文章标签：网络爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gbkhero/article/details/126283223

版权

网络爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近呢，有位小朋友说，他想搜集北京所有的景点信息，找来找去，找到某游记网站有大量的景点信息，想让我帮忙处理下。

一看景点信息确实不少，人工处理是不现实了，只能利用爬虫技术处理，首先抓个翻页包看看。

抓包请求：https://www.mafengwo.cn/ajax/router.php

在请求体参数中，有两个验签的参数，_ts和_sn，从字段名看应该就是时间戳和sign。

打开开发者工具，下XHR断点，最后追溯到此处，index.js应该是生成签名的地方。

一看代码是做了一定的混淆，字符串都没有直接显示，网上翻，找到此处。

__Ox2133f变量是字符串数字，用AST还原字符串看看。

还原以后，可以看到SparkMD5字样，看来签名跟md5有关，我们在回到签名算法的调用入口函数看看。

经过字符串还原，看起来清晰多了，从代码看_ts每次调用都会生成一个时间戳，_sn则是_0xe7fex35函数生成。

跟进_0xe7fex35瞧瞧，看到最后一行，是经过排序的data加盐md5生成的。

总结：

整个签名流程下来，感觉蛮简单的，防护强度不高，可以完全还原算法的那种。

一起交流学习，QQ: NTQwMTExMDI5(base64)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
某游记网_sn算法分析

最近呢，有位小朋友说，他想搜集北京所有的景点信息，找来找去，找到某游记网站有大量的景点信息，想让我帮忙处理下。
复制链接

扫一扫

专栏目录

gbkhero CSDN认证博客专家 CSDN认证企业博客

码龄14年

1: 原创

80万+: 周排名

192万+: 总排名

92: 访问

: 等级

11: 积分

2: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

某游记网_sn算法分析 93

分类专栏

网络爬虫 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。