2022拼夕夕anti_content参数解密(已更新20220110)

2022最新更新

本文仅供学习。
最近想练习自己的逆向能力,就找了这个网站。
首先找到加密入口,直接搜索anti_content关键字太多,我就直接xhr登录链接
在这里插入图片描述
然后点进去messagePack这个方法,然后开始抠js就行了 总共是2000多行js,最后用node执行就ok。
这是结果:
在这里插入图片描述

爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。
### 解决多多抓包返回值乱码问题 当遇到多多抓包返回值出现乱码的情况时,通常是因为编码设置不匹配所引起的。服务器端发送的数据可能采用特定字符集编码(如UTF-8),而客户端解析这些数据时使用的却是不同的编码方式。 #### 1. 确认响应头中的Content-Type字段 首先应当检查HTTP响应头部信息里的`Content-Type`属性,确认其是否指定了正确的字符集。如果未指定,则默认会按照ISO-8859-1来解码[^1]。 ```http Content-Type: text/html; charset=UTF-8 ``` #### 2. 修改浏览器或工具的编码选项 对于某些网络调试工具而言,在接收到未经声明编码类型的资源时,默认可能会应用错误的编码方式进行显示。此时可以尝试手动调整这类软件内部关于页面展示编码的相关配置项至目标站点实际运用的那种标准上去查看效果变化情况如何。 #### 3. 使用编程手段转换编码 假设是在编写自动化测试脚本或者是开发过程中遇到了此类状况的话,那么还可以考虑通过程序代码来进行转码操作: ```python import chardet def detect_and_convert_encoding(response_content): detected_info = chardet.detect(response_content) original_encoding = detected_info['encoding'] if not original_encoding or 'utf' not in original_encoding.lower(): try: decoded_text = response_content.decode('gbk').encode('utf-8') return decoded_text, "Converted from GBK to UTF-8" except UnicodeDecodeError as e: return None, f"Failed conversion with error {str(e)}" return response_content, "No need for conversion" # 假设response_data是从API获得的实际二进制响应体 converted_result, message = detect_and_convert_encoding(response_data) if converted_result is not None: print(f"{message}: \n{converted_result}") else: print(message) ``` 此段Python代码利用第三方库`chardet`自动探测输入字节流最有可能对应的原始编码形式;一旦发现不是UTF-8格式便执行由GBK到UTF-8之间的互换工作流程[^2]。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值