某直聘爬取-__zp_stoken__参数

前言

上一篇文章我们使用selenium爬取了工作信息,现在我们找接口去获取工作信息。


找接口


在这里插入图片描述
在这里插入图片描述
这些参数看字面意思都能理解,不过这个city参数需要想一下了,详情可以看下城市编码,直聘在此基础上做了一下改善,因为它上面没有地级市,所以县级市编码后几位就要顶替排在它前面的地级市,所以处理起来比较麻烦,不仅要清楚城市是地级市还是县级市,还要知道城市在省内的排名以及获取相应省内编码。因此我们为便捷可以先用selenium去获取想要城市的编码既可。

        driver = webdriver.Chrome(executable_path=r"E:\chromedriver-win64\chromedriver.exe")
        driver.get('https://www.zhipin.com/chengshi/c101260500/?ka=header-home')
        tag = driver.find_element_by_xpath('//*[@id="wrap"]/div[3]/div/div[1]/div[1]/form/div[2]/p/input')
        tag.send_keys(self.job+self.city)
        btn = driver.find_element_by_xpath('//*[@id="wrap"]/div[3]/div/div[1]/div[1]/form/button')
        btn.click()

        WebDriverWait(driver, 30).until(
            EC.presence_of_element_located((By.CLASS_NAME, "logo"))
        )
        print(re.findall("=(.\d+)",str(driver.current_url))[0])

__zp_stoken__参数

这个参数是cookie里面生成的,时效有限,所以我们需要逆向这个参数以此请求工作信息,我们搜索确定 __zp_stoken__生成的地方

在这里插入图片描述
通过下图断点发现其生成过程
在这里插入图片描述
在这里插入图片描述

你会发现__zp_stoken__它是由前面传入set方法里面的r值通过encodeURIComponent这个方法得来,并赋值给cookie,所以现在只要确定r的值就可以确定__zp_stoken__参数。


关于r值我们可以往前面看看,发现r的生成过程就是如图箭头所指,断点调试下去刚好到一个名叫864328f8js文件里面,再往下调试基本上也是这个文件夹里打转,所以我们复制这个文件,补好环境,跑一跑这个程序

在这里插入图片描述
在这里插入图片描述

最终结果如下(具体过程就省略了,想看源码的可以去资源看看):
在这里插入图片描述

  • 7
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Boss直聘对数据安全性进行了加密处理,其中一个加密字段是__zp_stoken__。这个字段是用于身份验证和安全访问的一种方式,确保用户的身份和数据的安全性。具体的生成流程和算法并没有公开的信息。如果你在进行逆向分析或爬取数据时遇到了问题,请注意Boss直聘的数据保护措施,并确保你的操作符合相关法律法规和隐私政策。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [2019年末逆向复习系列之Boss直聘Cookie加密字段__zp_stoken__逆向分析](https://blog.csdn.net/zhangge3663/article/details/109778462)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [boss直聘的爬取之js解密cookie的”__zp_stoken__”字段](https://blog.csdn.net/Lock_Jun/article/details/101768531)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [自我学习-逆向解析BOSS直聘cookie字段 _zp_stoken__加密](https://blog.csdn.net/qq_39960370/article/details/106242240)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值