自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 字体加密:在源代码中发现多个随机字库现象及解决思路

,发现字库对应内容有点不一样(基本上对字库里部分编码都有印象了),以次为突破口,发现下载的几个字库文件都不一样,此时明白了,网站在字库做了随机加密的处理,经过比对,发现字库有4-5个,而且部分字库编码有交叉。方法:自己搞一个glyf字典,把发现的3套字库(因为懒,太麻烦了,配套率超过50%,甚至达到75%,能大概率出正常结果就可以了)对应关系放进字典中,再用代码自己的遍历对比。所以,在遇到类似的问题现象时,排除代码错误的因素后,可以检查多次下载字库内容进行比对。结果:该改的都改了,都是正常的。

2023-03-29 06:23:47 237

原创 Scrapy:[scrapy.core.engine] DEBUG: Crawled (200)解决尝试

2、首页(目类内容)获取正常,进入目类中具体页面获取数据时报错,估算一下,获取量有点频繁,是否跟“得到”cateyes数据时被关“小黑屋”类似。当时,正常调试具体代码,但提前写了获取N页数据,run了几次就获取不到了,页面提示IP频繁,暂不能访问。抱着解决问题就是最好的学习收获的原则,开始解决尝试。1、网络正常,网页正常打开正常、配置正常、代码正常,说明自身和通道环节基本上没有问题。第二部:核对参数setting和items的py文件中的配置是否异常。结果,具体页面数据运行正常。

2023-03-29 05:54:21 3735 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除