原来写过一篇网易云的评论爬取 很不幸没搞懂js的加密 本次经过b站大佬提供的思路有幸去窥探了一下
首先吧链接放出来 av42632011 b站up主的视频 我讲的不好大家可以去看一看
首先对于爬虫来说反爬很要命 ip池 headers cookies js加密都是大问题
主要说明js加密 js加密根据up主所说都在下图
首先要会使用chrome工具 {}为js格式化 ctrl+f为查找
对于网易云他有两个参数
均为加密参数 加密一般存在于js中然后去sources文件中一个一个去找
这样就找到了 而且很明显它是由BY11X这个变量提供的 而 bY11x这个变量由asrsea这个函数赋值的 继续搜索
很明显 asrsea由d函数确定 而d函数由四个不知道的值进行传递 者可以用断点进行实验来找出规律 而后的思路就非常清晰根据
这些函数一个一个的推敲就好 没有太难的地方 还有一点需要注意 根据up主说有些变量是没有意义的 因此对于许多不知道从何而来的变量更重要的是试
最后有个问题最近在尝试珍爱网的登陆 可以也是卡死在js加密上 然而根据up的方法与思路仍然解决不了 ua这个值是怎样出来的 希望有大佬进行解答 或者一起探讨