猿人学-第四题

1.1 目标网站

https://match.yuanrenxue.com/match/4

1.2 查看响应内容和分析

1.2.1 响应内容

在这里插入图片描述

打上xhr断点, 查看请求加密方式
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2.2 逻辑分析

  • 取出datasHTML内容
  • 当HTML内容属性中包含生成的加密md5值, 隐藏标签display: none
  • 把HTML标签中除class="img_number"内容删除

注意:

返回HTML代码中带有style="left:0.0px"偏移值, 要计算偏移
通过测试发现, 可以将left 中的数值除以11.5通过下面运算可得到结果

2.1 代码

import requests
import hashlib
import base64
import re

headers = {
    'User-Agent': 'yuanrenxue.project',
    'Cookie': 'sessionid=mjjtd90ctnt3nrtbrzlw6k6ydd4ur05f'
}
img_dict = {
    '': 0,
    '': 1,
    '': 2,
    '': 3,
    '': 4,
    '': 5,
    '': 6,
    '': 7,
    '': 8,
    '': 9,
}


def get_img(page):
    url = "https://match.yuanrenxue.com/api/match/4"
    params = {
        "page": str(page)
    }
    res = requests.get(url, headers=headers, params=params)
    res_json = res.json()
    info_str = res_json['info']

    # 获取加密字符串
    key = res_json['key']
    value = res_json['value']
    encrypt_str = key + value

    # 进行base64编码后,再进行md5加密
    b64_str = base64.b64encode(encrypt_str.encode()).decode('utf-8')
    md5_str = hashlib.md5(b64_str.replace('=', '').encode()).hexdigest()

    return md5_str, info_str


def svg_img(md5_str, info_str):
    data_10 = re.findall('<td>(.*?)</td>', info_str)

    one_page_sum = 0
    for data_1 in data_10:
        info_list = re.findall('<img src="(.*?)" class="img_number (.*?)" style="left:(.*?)px">', data_1)
        num_list = []  # 实际数据
        svg_list = []  # 偏移量
        for info in info_list:
            if md5_str != info[1]:
                # 实际数据
                num = img_dict[info[0]]
                num_list.append(num)
                # 偏移量
                num_svg = int(float(info[2]) / 11.5)
                svg_list.append(num_svg)
        # 偏移操作
        new_list = ['0'] * len(num_list)
        for index in range(len(num_list)):
            id_ = index + svg_list[index]  # 计算偏移下标
            new_list[id_] = str(num_list[index])  # 偏移下标赋值
        # 求和
        one_page_sum += int(''.join(new_list))

    return one_page_sum


def main():
    all_sum = 0
    for page in range(1, 6):
        md5_str, info_str = get_img(page)
        one_page_sum = svg_img(md5_str, info_str)
        print(f'第-{page}-页总和:', one_page_sum)
        all_sum += one_page_sum

    print('5页总和: ', all_sum)


if __name__ == '__main__':
    main()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值