自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 关于严格反爬的网站爬取策略分享

对于该网站的爬取,我一开始打算做js逆向,该网站使用的是xsrf加密保护,虽然可以通过登录后端token实现短期自动发请求,但是程序员是什么群体,我们最懒了好吧:),想着看能不能用python去构造一个,试了两天,发现总是mismatch,真给我搞破防了,直接selenium+xpath大法,管你有的没的跟我的机器网瘾人类说去吧。在工作中挖掘数据的时候常常会遇到一些网站很严格的加密了请求,这时候通用的做法是逆向js解密,但这种方法费时费眼不说,大部分时候还解密不出来。

2025-07-08 15:09:11 941

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除