猿人学第四题-雪碧图、样式干扰(第一届)

 这里只放代码了,解析在下面代码的注释里,其他解析可参考我参考的文章。

参考文章:

 【猿人学WEB题目专解】猿人学第4题_user_from_future的博客-CSDN博客

猿人学web端爬虫攻防大赛赛题解析_第四题:雪碧图、样式干扰_itwxvq-CSDN博客 

var hexcase = 0;
var b64pad = "";
var chrsz = 8;

const jsdom = require("jsdom");
const { JSDOM } = jsdom;
const { window } = new JSDOM(`<!DOCTYPE html>`);
const $ = require('jQuery')(window);

function hex_md5(s) {
	return binl2hex(core_md5(str2binl(s), s.length * chrsz))
}
function b64_md5(s) {
	return binl2b64(core_md5(str2binl(s), s.length * chrsz))
}
function str_md5(s) {
	return binl2str(core_md5(str2binl(s), s.length * chrsz))
}
function hex_hmac_md5(key, data) {
	return binl2hex(core_hmac_md5(key, data))
}
function b64_hmac_md5(key, data) {
	return binl2b64(core_hmac_md5(key, data))
}
function str_hmac_md5(key, data) {
	return binl2str(core_hmac_md5(key, data))
}
function md5_vm_test() {
	return hex_md5("abc") == "900150983cd24fb0d6963f7d28e17f72"
}
function core_md5(x, len) {
	x[len >> 5] |= 0x80 << ((len) % 32);
	x[(((len + 64) >>> 9) << 4) + 14] = len;
	var a = 1732584193;
	var b = -271733879;
	var c = -1732584194;
	var d = 271733878;
	for (var i = 0; i < x.length; i += 16) {
		var olda = a;
		var oldb = b;
		var oldc = c;
		var oldd = d;
		a = md5_ff(a, b, c, d, x[i + 0], 7, -680876936);
		d = md5_ff(d, a, b, c, x[i + 1], 12, -389564586);
		c = md5_ff(c, d, a, b, x[i + 2], 17, 606105819);
		b = md5_ff(b, c, d, a, x[i + 3], 22, -1044525330);
		a = md5_ff(a, b, c, d, x[i + 4], 7, -176418897);
		d = md5_ff(d, a, b, c, x[i + 5], 12, 1200080426);
		c = md5_ff(c, d, a, b, x[i + 6], 17, -1473231341);
		b = md5_ff(b, c, d, a, x[i + 7], 22, -45705983);
		a = md5_ff(a, b, c, d, x[i + 8], 7, 1770035416);
		d = md5_ff(d, a, b, c, x[i + 9], 12, -1958414417);
		c = md5_ff(c, d, a, b, x[i + 10], 17, -42063);
		b = md5_ff(b, c, d, a, x[i + 11], 22, -1990404162);
		a = md5_ff(a, b, c, d, x[i + 12], 7, 1804603682);
		d = md5_ff(d, a, b, c, x[i + 13], 12, -40341101);
		c = md5_ff(c, d, a, b, x[i + 14], 17, -1502002290);
		b = md5_ff(b, c, d, a, x[i + 15], 22, 1236535329);
		a = md5_gg(a, b, c, d, x[i + 1], 5, -165796510);
		d = md5_gg(d, a, b, c, x[i + 6], 9, -1069501632);
		c = md5_gg(c, d, a, b, x[i + 11], 14, 643717713);
		b = md5_gg(b, c, d, a, x[i + 0], 20, -373897302);
		a = md5_gg(a, b, c, d, x[i + 5], 5, -701558691);
		d = md5_gg(d, a, b, c, x[i + 10], 9, 38016083);
		c = md5_gg(c, d, a, b, x[i + 15], 14, -660478335);
		b = md5_gg(b, c, d, a, x[i + 4], 20, -405537848);
		a = md5_gg(a, b, c, d, x[i + 9], 5, 568446438);
		d = md5_gg(d, a, b, c, x[i + 14], 9, -1019803690);
		c = md5_gg(c, d, a, b, x[i + 3], 14, -187363961);
		b = md5_gg(b, c, d, a, x[i + 8], 20, 1163531501);
		a = md5_gg(a, b, c, d, x[i + 13], 5, -1444681467);
		d = md5_gg(d, a, b, c, x[i + 2], 9, -51403784);
		c = md5_gg(c, d, a, b, x[i + 7], 14, 1735328473);
		b = md5_gg(b, c, d, a, x[i + 12], 20, -1926607734);
		a = md5_hh(a, b, c, d, x[i + 5], 4, -378558);
		d = md5_hh(d, a, b, c, x[i + 8], 11, -2022574463);
		c = md5_hh(c, d, a, b, x[i + 11], 16, 1839030562);
		b = md5_hh(b, c, d, a, x[i + 14], 23, -35309556);
		a = md5_hh(a, b, c, d, x[i + 1], 4, -1530992060);
		d = md5_hh(d, a, b, c, x[i + 4], 11, 1272893353);
		c = md5_hh(c, d, a, b, x[i + 7], 16, -155497632);
		b = md5_hh(b, c, d, a, x[i + 10], 23, -1094730640);
		a = md5_hh(a, b, c, d, x[i + 13], 4, 681279174);
		d = md5_hh(d, a, b, c, x[i + 0], 11, -358537222);
		c = md5_hh(c, d, a, b, x[i + 3], 16, -722521979);
		b = md5_hh(b, c, d, a, x[i + 6], 23, 76029189);
		a = md5_hh(a, b, c, d, x[i + 9], 4, -640364487);
		d = md5_hh(d, a, b, c, x[i + 12], 11, -421815835);
		c = md5_hh(c, d, a, b, x[i + 15], 16, 530742520);
		b = md5_hh(b, c, d, a, x[i + 2], 23, -995338651);
		a = md5_ii(a, b, c, d, x[i + 0], 6, -198630844);
		d = md5_ii(d, a, b, c, x[i + 7], 10, 1126891415);
		c = md5_ii(c, d, a, b, x[i + 14], 15, -1416354905);
		b = md5_ii(b, c, d, a, x[i + 5], 21, -57434055);
		a = md5_ii(a, b, c, d, x[i + 12], 6, 1700485571);
		d = md5_ii(d, a, b, c, x[i + 3], 10, -1894986606);
		c = md5_ii(c, d, a, b, x[i + 10], 15, -1051523);
		b = md5_ii(b, c, d, a, x[i + 1], 21, -2054922799);
		a = md5_ii(a, b, c, d, x[i + 8], 6, 1873313359);
		d = md5_ii(d, a, b, c, x[i + 15], 10, -30611744);
		c = md5_ii(c, d, a, b, x[i + 6], 15, -1560198380);
		b = md5_ii(b, c, d, a, x[i + 13], 21, 1309151649);
		a = md5_ii(a, b, c, d, x[i + 4], 6, -145523070);
		d = md5_ii(d, a, b, c, x[i + 11], 10, -1120210379);
		c = md5_ii(c, d, a, b, x[i + 2], 15, 718787259);
		b = md5_ii(b, c, d, a, x[i + 9], 21, -343485551);
		a = safe_add(a, olda);
		b = safe_add(b, oldb);
		c = safe_add(c, oldc);
		d = safe_add(d, oldd)
	}
	return Array(a, b, c, d)
}
function md5_cmn(q, a, b, x, s, t) {
	return safe_add(bit_rol(safe_add(safe_add(a, q), safe_add(x, t)), s), b)
}
function md5_ff(a, b, c, d, x, s, t) {
	return md5_cmn((b & c) | ((~b) & d), a, b, x, s, t)
}
function md5_gg(a, b, c, d, x, s, t) {
	return md5_cmn((b & d) | (c & (~d)), a, b, x, s, t)
}
function md5_hh(a, b, c, d, x, s, t) {
	return md5_cmn(b ^ c ^ d, a, b, x, s, t)
}
function md5_ii(a, b, c, d, x, s, t) {
	return md5_cmn(c ^ (b | (~d)), a, b, x, s, t)
}
function core_hmac_md5(key, data) {
	var bkey = str2binl(key);
	if (bkey.length > 16) bkey = core_md5(bkey, key.length * chrsz);
	var ipad = Array(16),
	opad = Array(16);
	for (var i = 0; i < 16; i++) {
		ipad[i] = bkey[i] ^ 0x36363636;
		opad[i] = bkey[i] ^ 0x5C5C5C5C
	}
	var hash = core_md5(ipad.concat(str2binl(data)), 512 + data.length * chrsz);
	return core_md5(opad.concat(hash), 512 + 128)
}
function safe_add(x, y) {
	var lsw = (x & 0xFFFF) + (y & 0xFFFF);
	var msw = (x >> 16) + (y >> 16) + (lsw >> 16);
	return (msw << 16) | (lsw & 0xFFFF)
}
function bit_rol(num, cnt) {
	return (num << cnt) | (num >>> (32 - cnt))
}
function str2binl(str) {
	var bin = Array();
	var mask = (1 << chrsz) - 1;
	for (var i = 0; i < str.length * chrsz; i += chrsz) bin[i >> 5] |= (str.charCodeAt(i / chrsz) & mask) << (i % 32);
	return bin
}
function binl2str(bin) {
	var str = "";
	var mask = (1 << chrsz) - 1;
	for (var i = 0; i < bin.length * 32; i += chrsz) str += String.fromCharCode((bin[i >> 5] >>> (i % 32)) & mask);
	return str
}
function binl2hex(binarray) {
	var hex_tab = hexcase ? "0123456789ABCDEF": "0123456789abcdef";
	var str = "";
	for (var i = 0; i < binarray.length * 4; i++) {
		str += hex_tab.charAt((binarray[i >> 2] >> ((i % 4) * 8 + 4)) & 0xF) + hex_tab.charAt((binarray[i >> 2] >> ((i % 4) * 8)) & 0xF)
	}
	return str
}
function binl2b64(binarray) {
	var tab = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
	var str = "";
	for (var i = 0; i < binarray.length * 4; i += 3) {
		var triplet = (((binarray[i >> 2] >> 8 * (i % 4)) & 0xFF) << 16) | (((binarray[i + 1 >> 2] >> 8 * ((i + 1) % 4)) & 0xFF) << 8) | ((binarray[i + 2 >> 2] >> 8 * ((i + 2) % 4)) & 0xFF);
		for (var j = 0; j < 4; j++) {
			if (i * 8 + j * 6 > binarray.length * 32) str += b64pad;
			else str += tab.charAt((triplet >> 6 * (3 - j)) & 0x3F)
		}
	}
	return str
}
n = function(a, b) {
	return new n.fn.init(a,b)
}
function run(key,value){   /*这个函数自己写的,用于获取j_key*/
	var j_key = hex_md5(btoa(key + value).replace(/=/g, ''));
	/*datas = info;
	$('.number').text('').append(datas);
	$(j_key).css('display', 'none');
	$('.img_number').removeClass().addClass('img_number')*/
	return j_key
}

 

'''
题目设计思路:首先,客户端向服务器发送请求,返回一个数据包(info是包含数字图片的HTML标签,key和value用于js隐藏图片的操作);
            然后,用js将数据包中的图片进行隐藏、偏移操作,最终加载到元素界面.
    难点:1.如何将数字图片转换为数字(比赛规定不能用图片识别)?
        2.如何找到偏移规律,将数字图片复位?

'''

import requests
import execjs
import json
from lxml import etree
import numpy as np


headers = {
    'authority': 'match.yuanrenxue.cn',
    'accept': 'application/json, text/javascript, */*; q=0.01',
    'accept-language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6',
    'cookie': 'sessionid=s6txbalcpqflb5rrikn4ezm002oj1oi3',
    'referer': 'https://match.yuanrenxue.cn/match/4',
    'user-agent': 'yuanrenxue.project',
}

response = requests.get('https://match.yuanrenxue.cn/api/match/4',headers=headers)  
data = json.loads(response.text)  # data是一个字典结构的数据包
info = data['info']
obj = execjs.compile(open('vs_project1\猿人学第四题\hex_md5.js').read())  #利用扣下来的加密代码获取关键参数j_key,图片中class属性值中含有这个参数的将不展示。
#params = [data['key'], data['value']]
j_key = obj.call("run", data['key'], data['value'])  # 计算j_key值,传参方式可以替换成obj.call("run", *params)

#发现相同数字图片的base64编码是一样的,所以这里选择用字典中一一对应的关系,将图片转化为数字,手动完成。
css_dict = {
    '':'0',
    '':'1',
    '':'2',
    '':'3',
    '':'4',
    '':'5',
    '':'6',
    '':'7',
    '':'8',
    '':'9'
}

html_tree = etree.HTML(info)      # 利用etree库解析数据包中的td标签
td_list = html_tree.xpath('//td') # 选择所有的td标签


def PX(A, num): # A为正确索引值列表,num为数值列表,该函数输出正确排序的数值
    dict={}
    for i in range(len(A)):
        dict[str(A[i])]=num[i]
    s=''
    for j in range(len(dict)):
        s+=dict[str(j)]
    return s


for td in td_list:           # 每一个td标签下有很多img,js正是对每个td标签下的img进行了隐藏,偏移操作,所以这个for循环下有很多相应的操作。
    td_idv = etree.tostring(td).decode('utf-8')  # 用tostring()获得每个模块的td标签,命名为td_idv。
    td_idv_list = td.xpath('./img')         #用xpath选择td下的所有img, td_idv_list是一个列表类型。
    num = []   # 用于存放所显示的数字
    num_pos = []  # 用于存放num中数字的索引值
    num_iv = []   # 用于存放num中数字的偏移值

    for img in td_idv_list:       # 每个td_idv下的img标签
        cla = img.xpath('./@class')[0]  #cla为img的class属性值
        src = img.xpath('./@src')[0]    #src为img的src属性值
        style = img.xpath('./@style')[0] #style为img的style属性值
        if j_key in cla:    # 如果j_key值存在于img的class属性值,则把这个img移除。
            td.remove(img)   
        else:              # 如果j_key不在img的class属性值里:
            img.attrib.pop('class')  # 将img的class属性及属性值删除
            img.set('style',style.replace('left:', '').replace('px', '')) # 将img的style属性值中'left:'和'px'换为空值,因为这样方便获取其偏移值。
            img.set('src',css_dict[src])   # 将src的属性值设定为css_dict[src],其实就是把src中图片base64编码内容换为数值。
            
            a = str(img.xpath('./@src')[0])  # 用a代表数值,并转换为str类型
            b = int(float(img.xpath('./@style')[0])/11.5)  # 用b代表 偏移值/11.5 的值,我们发现其偏移值总是11.5的倍数,为了方便操作,都将其除以11.5
            num.append(a)  # 将a存放在列表num中
            num_iv.append(b)  # 将b存放在列表num_iv中
    for i in range(len(num)): #这个for循环将num中的初始索引值单独存放在列表num_pos中
        num_pos.append(i)
    A = list(np.array(num_pos) + np.array(num_iv)) # 利用矩阵的加法,将初始索引值和偏移值相加,得到正确的索引值,到这里就解决了偏移问题。
    print(PX(A, num))
    #print(etree.tostring(td, pretty_print=True).decode('utf-8')) # 输出显示数字的HTML+
    #print('&*%^'*50)

  • 10
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值