js 获得明天0点时间戳_爬虫实例（四）某不知名网站的js反爬-CSDN博客

目标网站：

http://www.pbc.gov.cn/jinrongwendingju/146766/index.htmlwww.pbc.gov.cn

chrome走起，进入目标网站后ctrl+U，发现好像没有反爬？requests试一下

import

OK，走你~

一堆混淆过的js？

打开fiddler，刷新下目标网站。

然后发现，#1的请求返回的就是混淆过的js，然后网页进入了#2的url，#2又302重定向回了原目标网站，对比一下#1和#3两个请求，我们发现cookie变了，这时我们随便点进入一个新闻，观察fiddler的抓包情况，发现已经可以正常获得页面了，而新闻页面和#3的cookie是一样的。思路这时候就有了，读js，找到#2的url，重定向到#3后获取cookie或者直接session。

下一步读js，chrome在目标页面F12进入开发者选项，F1禁用js，刷新页面

什么破玩意儿咱先不管，ctrl+U看看源码。

好吧，脑壳疼，简单的反混淆吧，找个网站把这段代码格式化，再把eval语句变成正常人读的语句，然后就变成了这样。

然后把这些_0x3fb5e之类的破变量也变成人读的。

import re

# 读取js网页
with open('test.html', 'r') as f:
    html = f.read()

# 把不是人看的变量名换成是人看的
real_name = iter('a' + str(i) for i in range(5000))
faker_name = set(re.findall(r'_0xw{4,6}', html))
print(faker_name)
for i in faker_name:
    html = html.replace(i, real_name.__next__())

# 重新写入
with open('test.html', 'w') as f:
    f.write(html)