小破站w_rid获取，逆向算法

原创已于 2024-06-05 10:54:53 修改 · 1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#python #网络爬虫 #爬虫

于 2024-06-05 10:06:49 首次发布

Web逆向分享专栏收录该内容

1 篇文章

订阅专栏

文章目录

背景
开始分析
代码还原算法
总结

免责声明：本教程仅供学习和研究爬虫技术使用，严禁将所学知识用于违法、侵害他人隐私或利益的行为。任何使用本教程所提供信息造成的法律责任由读者自行承担，作者不承担任何法律责任。请在遵守相关法律法规的前提下，谨慎使用爬虫技术，遵守网站的使用规定。如有疑问或争议，请及时与网站管理员联系解决，作者不承担任何责任。感谢您阅读本教程，并希望能通过学习爬虫技术带来更多的收获和成就感。

背景

最近有朋友找到作者，在b站想找一些关于符合某种条件的博主联系，进而有一些合作，但是通过一个一个人工去寻找并筛查实在太麻烦，于是开始分析！

开始分析

打开F12点击查询
查询请求参数
多次请求发现，w_rid和wts是一直在变化
全局开搜定位到 w_rid位置下断点
组装w_rid
经分析wts就是当前系统的时间戳，w_rid如图就是请求所有url参数通过排序拼接后加上一个通过固定算法生成的32位字符，值为固定ea1db124af3c7062474693fa704f4ff8

代码还原算法

python模拟算法，结构与预期一致
组装w_rid算法

w_rid ， python实现如下

import hashlib

params = {
    "category_id": '',
    "search_type": "bili_user",
    "ad_resource": 5646,
    "__refresh__": 'true',
    "_extra": "",
    "context": "",
    "page": 1,
    "page_size": 36,
    "order": "",
    "duration": "",
    "from_source": "",
    "from_spmid": "333.337",
    "platform": "pc",
    "highlight": 1,
    "single_column": 0,
    "keyword": "1",
    "qv_id": "cookie获取qv_id",
    "source_tag": 3,
    "gaia_vtoken": "",
    "order_sort": 0,
    "user_type": 0,
    "dynamic_offset": 0,
    "web_location": 1430654,
    "wts": 1717500185, #当前时间
}


def calculate_md5(string):
    md5_hash = hashlib.md5()
    md5_hash.update(string.encode('utf-8'))
    return md5_hash.hexdigest()

query_string = '&'.join([f"{key}={params[key]}" for key in sorted(params.keys())])

print(query_string)
wrid = calculate_md5(query_string + 'ea1db124af3c7062474693fa704f4ff8')
print(wrid)