爬虫
文章平均质量分 78
丶无聊。
这个作者很懒,什么都没留下…
展开
-
将base64格式的字体信息解码成可用的字体文件
收到了SegmentFault的一封私信:https://segmentfault.com/annual-report-2016#/start 好奇检查了一下这是什么字体: 。。好吧我确定没有这个字体,那就是自定义的字体了。 检查了HTTP请求,有这么一个请求: 虽然请求的都是字体文件但是第一个明显更清新脱俗一些,他是base64编码的,data:font/opentype;base64,T...转载 2018-10-24 11:16:28 · 1232 阅读 · 0 评论 -
爬虫进阶教程:极验(GEETEST)验证码破解教程
摘要: 爬虫最大的敌人之一是什么?没错,验证码!Geetest作为提供验证码服务的行家,市场占有率还是蛮高的。遇到Geetest提供的滑动验证码怎么破?授人予鱼不如授人予渔,接下来就为大家呈现本教程的精彩内容。 一、前言 爬虫最大的敌人之一是什么?没错,验证码!Geetest作为提供验证码服务的行家,市场占有率还是蛮高的。遇到Geetest提供的滑动验证码怎么破? 一种方法是分析它的j...转载 2018-10-24 18:11:52 · 4768 阅读 · 0 评论 -
某8网站字体加密爬虫的处理方法
某8网站字体加密爬虫的处理方法 阅读原文 某8网站的一些数据在浏览器里面显示是正常的, 但是渲染前和渲染后的html源码都看不到字体, 渲染前看到的是16进制的4位字符, 渲染后看到的是一些方块. 搜索找到猫眼和汽车之家的解决方法, 某8网站比这些都复杂, 经过多次尝试得到解决. 首先在html源码里面找到woff字体的base4编码, 保存成”font.woff”字体文件, 用fon...转载 2018-10-24 18:26:19 · 2300 阅读 · 1 评论