- 博客(3)
- 收藏
- 关注
原创 【原创】针对动态字体反爬技术的解决方案 爬虫 python 字体 fontforge 设计 反爬
别的文章应该介绍的很详细我这里不多做赘述,简单来说就是针对字体文件做了混淆使得网页中的字形轮廓描述与本身的内容不匹配,导致爬取的数据出现“乱码”的情况。使用手机端的ua能直接拿到数据,但是用网页端是没有办法拿到的,而且不能加其他请求头参数,加了就会拿不到数据,怪。这里爬取的是盐xuan的会员文章,用的cookie是冲过会员的cookie。最后在通过 ocr 字体识别就可以得到正确的字形 字体编码的对应表。通过以上调用就可以实现自动化的字体文件中的字体轮廓数据转换成图片。
2024-04-09 12:02:11
800
原创 pydantic.env_settings.SettingsError: error parsing env var “superusers“ nonebot2配置报错
关于nonebot2新版的配置文件修改
2023-10-01 23:07:10
353
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人