Python爬虫进阶必备 | XX文学加密分析实例

最新推荐文章于 2021-01-12 03:11:54 发布

咸鱼学 Python

最新推荐文章于 2021-01-12 03:11:54 发布

阅读量275

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43189702/article/details/103471412

版权

点击上方“咸鱼学Python”，选择“加为星标”

第一时间关注Python技术干货！

建议收藏 | 最全的 JS 逆向入门教程合集

目标网站：

aHR0cHM6Ly93d3cuYWxpd3guY29tLmNuL3JlYWRlcj9iaWQ9NjgxMzkyMyZjaWQ9Njc0MTc0

抓包分析与加密定位

这个网站上一篇文章的加密的形式是一样的，也是对正文的内容进行加密完成反爬。

一样还是先抓包看下请求【图1-1】

null

图1-1

请求的参数有一个 sign值疑似加密，接下来看看返回的正文加密的内容【图1-2】

null

图1-2

可以看到ChapterContent这个值是加密的字段。

按照上一篇文章的思路，我们直接检索看看。【图1-3】

null

图1-3

根据这一个结果继续跟进文件看看【图1-4】

null

图1-4

在文件中的检索结果有两个，但是并不妨碍我们直接可以猜到加密的位置是123行，这个_decodeCont从语义上还是比较好分别出来这个就是解密的地方。

还是打上断点重新加载一下，可以看到传入的参数就是我们刚刚在【图1-2】中看到的密文。【图1-5】

null

图1-5

我们继续跟进去就可以看到这个解密方法的全貌了。【图1-6】

null

图1-6

这个解密的逻辑看着就很简单。

接下来继续看看上面疑似加密的sign 值。

通过直接检索没找到加密的位置，后面发现这个值是直接通过页面传递的。

加密分析与扣取

这个加密并没有应用其他的加密方法，直接把加密的整个函数扣取出来就完事了。

传入加密的密文，运行一下就可以看到明文了。【图2-1】

null

图2-1

Python 爬取

上面疑似加密的地方已经全部找到了。

所以通过 Python 爬取的难度近乎于无，但还是要简单尝试一下，还是使用execjs 执行我们扣取好的 js 文件。

with open('decrypt.js', 'rb') as f:
    js = f.read().decode()

其他的代码就是 request + xpath 没啥新的东西。

直接上结果【图3-1】

null

以上就是今天网站加密分析的全部内容了，如果对你有帮助，希望可以点个好看支持一下~

感谢~

咸鱼学 Python

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫进阶必备 | XX文学加密分析实例

点击上方“咸鱼学Python”，选择“加为星标”第一时间关注Python技术干货！建议收藏 | 最全的 JS 逆向入门教程合集目标网站：aHR0cHM6Ly93d3cuYWxpd3guY...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。