瑞数专题一

目前在国内,一般反pa手段不是验证码就是js加密,瑞数也是作为圈内让人比较让人头疼的一种,下面就来依次介绍一下关于瑞数反爬的一种思路,具体的分析流程我就以图片的形式分别展示一下关于5代,5.5代,6代瑞数的流程,目前爬虫圈里大佬们都说现在是人均4代,所以4代就暂时不再分析,后期会单独出一篇关于4代的流程分析。

本次全程cookie值得获取都是以调用我写好的接口为主.搞过瑞数的都知道,各种补环境,各种调试,真的很费脑。

目前能搞瑞数的并且能成功求取的大不了有2种方式。第一:扣js逻辑,第二:rpc。

关于cookie的生成形式作者以函数的形式写了一个方法,服务器地址就不贴出来了


def function_cookie(data_list):
    host_ip='https://**********/qin/api/get_cookies' //这里是作者为的服务器地址
    post_data={
        'web_url' : data_list[0],          //瑞数网站的链接
        'frist_cookie_name' : data_list[1],//cookie的第一个值,一般比较短
        'second_cookie_name': data_list[2],//cookie的第二个值
        'threading': 1                     //线程数,也表示获取cookie的数量
        }
    data=requests.post(url=host_ip,headers=headers,data=json.dumps(post_data))
    return data.json()

在这里贴一个服务器返回的数据

请求成功:

请求返回数据: {'code': 200, 'response_data': [{'neCYtZEjo8GmO': 
'5YcZ.dIFgqCuaig7TT6kB6Nczf4IKW1dstDHufYQaXMMEFVNZKHxeL1DzuGvh.rn4aOVyZKT5XMNpYfZBmA8REA', 'neCYtZEjo8GmP': '53XlbXbhfxvWqqqDcH6eocABoVvFzArVApFuyXAOKFpZ6Nytkffm2lXhMZdHfi2Il9Z1fODVtaczcN_q9ZNPcDe5P4F1SwTocNfTAKzk9r74uSa2EwzsrUL_U0uNqrB959yapRc2GNTdsABw5zJJleD'}]}

请求失败:

请求返回数据: {'code': 400, 'error_message': '请检查请求参数'}

旧版5代瑞数我们以目前流行的大网站--某yao监局为例:

网址:aHR0cHM6Ly93d3cubm1wYS5nb3YuY24v

大家可以清一下浏览器缓存,打上Script断点单步执行f8,一直跟到index.html里直接搜索.call就能找到5代加密的函数入口

b2d36ac33c98490380fa396841a1fb2c.png

 

关于5代的cookie值也有很多种,目前yao监局是neCYtZEjo8GmO,neCYtZEjo8GmP

6dfb25afc0164ec18750ca6386ffd47f.png

 

不携带cookie访问首页时状态码为202,请求失败

7d1ca6b1b4a44932a4f4702f55e48f9a.png

 携带cookie值时访问首页时状态码为200,请求成功

ff34f43337fe4cc58777f1839043ae9b.png

 以上是关于5代的请求案例

新版5.5代瑞数我们以*普期刊为例:

网址:aHR0cDovL2xpYi5jcXZpcC5jb20v

还是与上面的流程一样,打上Script断点,单步执行f8,一直跟到index.html里直接搜索S{4} = S{4}[S就能找到5.5代加密的函数入口,大家可以参考下面的入口函数。

d3c88e24982d4b219a6023920c9a29a3.png

关于新版的5代瑞数的cookie字段也有很多,维普现在是GW1gelwM5YZuS,GW1gelwM5YZuT

804aeee3033645979bac20d7d382ae98.png

不携带cookie访问首页时状态码为412,请求失败

4ed47835b2364f01a25b567e70d1c4d5.png

  

携带cookie值时访问首页时状态码为200,请求成功

37fec6f9f10446cda98f118af78aa8c9.png

以上则是关于新版5代的请求案例 

6代的瑞数的话目前使用的网站不多,目前作者了解的就只有专利网。所以作者就以专利网来举例。

网址:aHR0cDovL2VwdWIuY25pcGEuZ292LmNuL3BhdGVudC9DTjEwNTYzNzU1NQ==

验证流程大致也差不多就不具体介绍了,直接看图吧,偷偷懒,哈哈。

d4e68a9a580441e596944ad8986c53be.png

不携带cookie访问首页时状态码为202,请求失败

79adf90784ae476eb864514509c8a9b3.png

携带服务器返回的cookie,状态码200,请求成功 

d1ba54b0453040b28085a66503ab6fef.png

提示:若是侵权请联系作者删除。 

  • 3
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

逆向学习之旅

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值