爬虫_06_余票检测&js解加密

最新推荐文章于 2024-05-09 14:20:48 发布

小明2766

最新推荐文章于 2024-05-09 14:20:48 发布

阅读量424

点赞数

分类专栏： # B站爬虫学习文章标签： python 爬虫

本文链接：https://blog.csdn.net/bill2766/article/details/113804236

版权

B站爬虫学习专栏收录该内容

10 篇文章 1 订阅

订阅专栏

06_余票检测&js解加密&12306模拟登录

余票检测1️⃣

JS解密+混淆破解

博客地址：https://www.cnblogs.com/bobo-zhang/p/11243138.html
爬取的网站：https://www.aqistudy.cn/html/city_detail.html

分析

修改查询条件（城市的名称+时间范围），点击查询按钮，捕获点击按钮后发起请求对应的数据包。点击查询按钮后，发起的是ajax请求。该请求就会指定查询条件对应的数据加载到当前页面中。（我们要爬取的数据就是该ajax请求请求到的数据）
分析捕获到的数据包
- 提取出请求的url：https://www.aqistudy.cn/apinew/aqistudyapi.php
- 请求方式：post
- 请求参数：d:动态变化的一组数据（且加密）
- 响应数据：是加密的密文数据
  - 问题：该数据包请求到的是密文数据，为何在前台页面显示的却是原文数据？
  - 原因：请求请求到密文数据后，前台接收到密文数据后使用指定的解密操作（js函数）对密文数据进行了解密，然后将原文数据显示在了前台页面。
- 下一步工作的步骤：
  - 首先先处理动态变化的请求参数，动态获取该参数的话，就可以携带该参数进行请求参数，将请求到的密文数据捕获到。
  - 将捕获到的密文数据找到对应的解密函数对其进行解密即可。
  - 【重点】需要找到点击查询按钮后对应的ajax请求代码，从这组代码中就可以破解动态变化的请求参数和加密的响应数据对应的相关操作
找ajax请求对应的代码，分析代码获取参数d的生成，和加密的响应数据的解密操作

3.1 处理动态变化的请求参数

基于火狐浏览器定位查询按钮绑定的点击事件。
从getData函数实现中找寻ajax请求对应的代码
- 从getData函数的实现中没有找到ajax代码，但是发现了另外两个函数的调用
  - getAQIData(); getWeatherData(); ajax代码一定是存在于这两个函数实现内部
  - type == HOUR：查询时间是以小时为单位
分析getAQIData(); getWeatherData()：找到ajax代码
- 没有找到ajax请求代码
- 发现了另一个函数调用：getServerData(method,param,func,0.5)
  - method = ‘GETCITYWEATHER’ or ‘GETDETAIL’
  - params = {city,type,startTime,endTime}：查询条件
分析getServerData，找寻ajax代码
- 基于抓包工具做全局搜索
- 找到的函数实现被加密
- 对getServerData加密的实现进行解密
  - js混淆：对核心的js代码进行加密
  - js反混淆：对js加密代码进行解密
    - 暴力破解：https://www.sojson.com/jscodeconfusion.html
    - 终于看到了ajax实现的代码
    - 分析结论：
      - data：加密的响应数据
        decodeData(data)将加密的响应数据进行解密
        参数data：加密的响应数据
      - param：动态变化且加密的请求参数
        getParam(method,object)返回动态变化的请求参数
        参数method：method = ‘GETCITYWEATHER’ or ‘GETDETAIL’
        参数object：{city,type,startTime,endTime}：查询条件

js逆向

现在只需要调用两个js函数（decodeData，getParam）返回结果即可。在python程序中如何调用js函数。
js逆向：在python中调用js函数
1. 方式1：手动的将js函数改写成为python函数
2. 方式2：
  - 使用固定模块实现自动逆向（推荐）
  - 利用PyExecJS库来实现模拟JavaScript代码执行获取动态加密的请求参数，然后再将加密的响应数据代入decodeData进行解密即可！
  - 在本机安装好nodejs的环境

PyExecJS的使用2️⃣

#模拟执行decodeData的js函数对加密的响应数据进行解密
import execjs
import requests

node = execjs.get()

#Params
method = "GETCITYWEATHER"
city = '北京'
type = 'HOUR'
start_time = '2018-01-25 00:00:00'
end_time = '2018-01-25 23:00:00'

#Compile javascript
file = 'jsCode.js'
ctx = node.compile(open(file.,encoding='utf-8').read())

#Get params
js = 'getPostParamCode("{0}","{1}","{2}","{3}","{4}")'.format(method,city,type,start_time,end_time)
#请求参数d
params = ctx.eval(js) #eval执行指定的js函数

#发起post请求
url = 'https://www.aqistudy.cn/apinew/aqistudyapi.php'
data = {
    'd':params
}
response_text = requests.post(url=url,data=data).text #加密的响应数据

#对加密的响应数据进行解密
js = 'decodeData("{0}")'.format(response_text)
decrypted = ctx.eval(js) #返回的是解密后的原文数据
print(decrypted_data)
#执行会报错：目前页面中没有数据。解密函数只是针对页面中原始的数据进行解密。
(response_text)
decrypted = ctx.eval(js) #返回的是解密后的原文数据
print(decrypted_data)
#执行会报错：目前页面中没有数据。解密函数只是针对页面中原始的数据进行解密。

小明2766

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫_06_余票检测&js解加密

06_余票检测&js解加密&12306模拟登录余票检测1️⃣JS解密+混淆破解博客地址：https://www.cnblogs.com/bobo-zhang/p/11243138.html爬取的网站：https://www.aqistudy.cn/html/city_detail.html分析修改查询条件（城市的名称+时间范围），点击查询按钮，捕获点击按钮后发起请求对应的数据包。点击查询按钮后，发起的是ajax请求。该请求就会指定查询条件对应的数据加载到当前页面中。（我们
复制链接

扫一扫