如何获取boss直聘搜索牛人被屏蔽的姓名

点击上方蓝字[协议分析与还原]关注我们


 玩玩boss直聘。

最近在用boss直聘,活跃度估计蛮高的。

在使用牛人搜索的时候,却遇到了一个问题,就是搜出的牛人姓名是被屏蔽的,让我很是焦虑,虽然知道这种设计是直聘推广畅聊卡的需要,但我仍然很焦虑,很想看到被屏蔽的人名,因为在推荐页面能看到推荐的人名。

不知道充钱了能不能直接看到人名,但是,我没有充钱的需求呀,看样子我只有发挥自己的特长来解决问题了,当然,问题解决了,竟然索然无味。

在这里省略一些步骤,我们事先在其它页面的分析中得到了获取个人信息的链接:

https://www.zhipin.com/wapi/zpboss/h5/geek/detail/get?uid=xxxx~

里面有姓名,如果想看到姓名,需要找到这个uid的值。

那么,我们要去找这个值。

首先,在pc端Chrome浏览器上,按F12进入调试模式,点你想看的牛人,很容易找到这个页面的链接:

链接很长,大概这样子:

https://www.zhipin.com/boss/search/geek/info?lid=49rxnw4SzHI.lookupsearchgeek.1&expectId=aaa&securityId=xxxxx~&segs=boss

可以直接访问,当然,仍然看不到姓名,很不开心,里面的各个id尝试了一番,没有获取到正确的人的id,倒是有个encryptId,能访问到不正确的人的信息。

仔细一看,可以转发,于是尝试发到邮箱试试,依稀记得,以前发到邮箱,是能够从链接中获取到这个id的,但时过境迁,现在如何,需要再分析。

进邮箱,打开链接,链接大概这样子:

https://m.zhipin.com/vue/index/#/dashboard/candidate/resume?expectId=102093053&isInnerAccount=0&isResume=1&isPreview=0&status=5jobId%3D-1&securityId=xxxxx~

当然,没有id,姓名仍然被屏蔽,几乎要放弃了,但是,再坚持一下,曙光就在眼前。

分析这个页面,得到页面内个人信息的获取链接,访问它:

https://m.zhipin.com/wapi/zpboss/h5/geek/detail/get?expectId=aaa&lid=xxxxx&securityId=xxxxx~~&_=vv

得到一个美丽的json数据:

里面很多id项,但是没有我们想要的id,名字仍然是看到的***,不过在问答相关的url中:

https://m.zhipin.com/H5/html/question_answer_new/more-question.html?encryptGeekId=xxx

有一个参数encryptGeekId,它的值就是我们要找的值。

拿到它,去构造获取个人信息的链接,直接访问:

终于在里面找到了被屏蔽的名字,好开森。

点到为止哦,boss直聘的兄弟看到了,赶紧改下,把该清理的数据联系清理干净,你们这几个页面的逻辑是不是好几个人各做一块呀?不好。

在这里学习技术的朋友,不要关注结果,多注意思维的过程,不同组织的交互点,一般是系统的薄弱点,从一个个的个体,到系统内部的组织间以及系统外部的接口及交互,都很容易找到一些有趣的信息。



长按进行关注,时刻进行交流。

点击“在看”,与朋友一起分享↘

爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值