Python 爬虫 | 猿人学第六题

最新推荐文章于 2023-09-02 21:15:33 发布

Python爬虫与数据分析

最新推荐文章于 2023-09-02 21:15:33 发布

阅读量215

点赞数

文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_44623587/article/details/126070573

版权

今天讲猿人学第六题

地址：

http://match.yuanrenxue.com/match/6

1、环境

Python3.7、pyexecjs、requests

2、分析网站

数据接口很容易找到的，这个刷题网站的数据接口都是一样的形式。

图2-1

图2-2

这个数据接口有两个参数m、q，有加密参数就进js调试呗。

图2-3

图2-4

t = Date.parse(new Date());
var list = {
    "page": window.page,
    "m": r(t, window.o),
    "q": window.i += window.o + '-' + t + "|",
};

m是r函数传入t、window.o得到的，t是时间戳

打断点进r函数看看

图2-5

如图2-5看到一个类似密钥的字符串大概就是RSA加密了，看到这里其实就差不多了，直接把全部代码扣下来。

注意：这里拿到的是三等奖的数据，但是题目要求的是总金额，总金额其实就是三等奖乘24，这个可以在返回的代码中看到的（有任何不明白逻辑的就看源码，源码肯定可以找到）。

图2-6

图2-7

3、代码实现

这里讲几个坑，你们调试的时候都会遇到，这里我就不一步步调试了直接拿出来讲，这代码中有部分是混淆过的。

图3-1

代码开头的部分有一大堆的表情符如图3-1，刚看到的时候直呼牛逼啊这都行。我不会，但是不会没关系可以百度啊，JavaScript表情符加密，得知是aaencode加密，再搜aaencode在线解码呗。

图3-2

解密的结果是window.o = 1;

图3-3

window是全局变量，赋值global，同时把原来的window={}注释掉。

图3-4

我封装好了一个函数，方便调用，运行看看结果

结果是：Message too long for RSA，返回了一个false

这就难办了，需要一步步调试和网页的进行比对，找出差异，这里我就直接点出来。

图3-5

这里有一大段的混淆，抠出来放在consloe中运行。

图3-6

替换一下就好了，如图3-7

图3-7

全部代码

import time
import execjs
import requests

headers = {
        'Host': 'match.yuanrenxue.com',
        'Referer': 'http://match.yuanrenxue.com/match/6',
        'User-Agent': 'yuanrenxue.project',
    }
with open('第六题.js', 'r', encoding='utf-8') as f:
    jstext = f.read()
for page in range(1, 6):
    timestamp = int(time.time()) * 1000
    m = execjs.compile(jstext).call('get_m', timestamp)
    data = {
        'page': page,
        'm': m,
        'q': f'1-{timestamp}|'
    }
    url = f'http://match.yuanrenxue.com/api/match/6?page={page}&m={m}&q=1-{timestamp}|'
    response = requests.get(url, headers=headers, params=data)
    print(response.json()['data'])

运行结果：

需要相关的js代码请私信我。

Python爬虫与数据分析

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Python 爬虫 | 猿人学第六题

今天讲猿人学第六题地址：http://match.yuanrenxue.com/match/6目录：1、环境2、分析请求3、实现爬取1、环境Python3.7、pyexecjs、requests2、分析网站数据接口很容易找到的，这个刷题网站的数据接口都是一样的形式。图2-1图2-2这个数据接口有两个参数m、q，有加密参数就进js调试呗。图2-3图2-4t = Date.parse(new Date...
复制链接

扫一扫