从头学习爬虫（四十五）高阶篇----字体加密

最新推荐文章于 2024-03-01 09:00:00 发布

Decoxy

最新推荐文章于 2024-03-01 09:00:00 发布

阅读量606

点赞数

本文链接：https://blog.csdn.net/qq_36783371/article/details/98589093

版权

本文主要帮助解决字体加密的反爬虫策略

一需求

https://www.china.cn/buy/4432149572.html

二分析请求

页面展示

显然是字体进行了加密，然后打开字体和其他看看有没有加载字体的资源文件，发现没有。

看响应内容

可以发现一个base64的字体文件。

三实操

首先把base64转成文件

 //BASE64解码成File文件
    public static void base64ToFile(String destPath,String base64, String fileName) {
        File file = null;
        //创建文件目录
        String filePath=destPath;
        File  dir=new File(filePath);
        if (!dir.exists() && !dir.isDirectory()) {
            dir.mkdirs();
        }
        BufferedOutputStream bos = null;
        java.io.FileOutputStream fos = null;
        try {
            byte[] bytes = Base64.getDecoder().decode(base64);
            file=new File(filePath+"/"+fileName);
            fos = new java.io.FileOutputStream(file);
            bos = new BufferedOutputStream(fos);
            bos.write(bytes);
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            if (bos != null) {
                try {
                    bos.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
            if (fos != null) {
                try {
                    fos.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }

转成一个ttf字体文件

然后安装一个软件

打开可以看到

转义一下

<h2><span class=" secret">&#x100a7;&#x100a8;&#x100a5;&#x100a6;</span></h2>

<h2><span class=" secret">采购腰包</span></h2>

四总结

整个流程大致分析了字体加密的解析方法。字体文件格式有多种可能需要转换格式,还有每个页面都有不一定字体文件，不能统一替换，需要对字体文件进行代码解析然后替换。

Decoxy

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

从头学习爬虫（四十五）高阶篇----字体加密

一 需求

二 分析请求

三 实操

四 总结

一需求

二分析请求

三实操

四总结