大众点评字体_大众点评美食——字体字典生成（二）

最新推荐文章于 2021-11-30 13:46:37 发布

weixin_39560245

最新推荐文章于 2021-11-30 13:46:37 发布

阅读量389

点赞数

文章标签：大众点评字体

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39560245/article/details/111790439

版权

紧接上篇介绍了字体加密中字体文件和页面源码中的对应关系，要获取数据你还需要一份字典！

pycharm一开一顿操作猛如虎

一、获取页面源码并提取css的链接

二、下载其中的四个类型标签对应的woff文件

打开来康康

两个文件里面的字体竟然是一样的，只有编码不同，也就是说加密的字体只有这600多个

三、woff转xml

直接的woff文件python不好操作，先用fontTools转为xml文件

from fontTools.ttLib import TTFont font = TTFont('./font_files/' + woff_file_name + '.woff')

font.saveXML('./font_files/' + woff_file_name + '.xml')

生成之后随便开一个xml看一下

GlyphID 标签的name就是编码(GlyphID 的顺序和woff文件里面你看字体的顺序是一样的)

TTGlyph标签就是每个字体的样式(需要注意的是这个顺序和GlyphID的顺序不同，只能通过name来对应回去)

四、真实文本获取

写一个简单的vue用同样的操作渲染出全部字体然后百度识图送检一波 (对于规整的字形准确率100%

然后你就拿到所有的python能识别的文字了！！

现在你有三份资料：

partA：GlyphID 标签的name中的编码

partB：TTGlyph标签的所有内容

partC：百度识图出来和GlyphID 标签的name中的编码顺序一致的文本

事实上当前页面已经解析完了，编码和文本对应成功，写一个字典对应即可，但是大众点评的不是每天都用同一套woff(每套woff里面的编码不同)，所以为了可持续发展，在有需要时可以快速构建编码和文本对应的新字典，你还需要对partB下手,partB和partA可以映射，partA和partC可以映射，所以C和B可映射，partB(字形)每次都是不变的，文本也是不变的，最终你构建的是字形和文本的对应，这使你在编码变更时能快速获得最新的编码和文本对应的新字典。

五、字形和文本的对应以及入库

先用现有明确编码将字形和文本对应

对字形对应文本进行md5编码在对应文本入库(md5前要删除name属性中的文本)

入库成功(字形md5以及对应文字)

再写一个读数据库根据字形md5-文本生成编码-文本字典的生成

拿着新字典测试

对应成功合影留念~

其他更细的处理细节就不一一说了源码放一份在github 有需要可以自行获取！

↓

完整代码

下期有时间说说另一种字体加密！

weixin_39560245

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大众点评字体_大众点评美食——字体字典生成（二）

紧接上篇介绍了字体加密中字体文件和页面源码中的对应关系，要获取数据你还需要一份字典！pycharm一开一顿操作猛如虎一、获取页面源码并提取css的链接二、下载其中的四个类型标签对应的woff文件打开来康康两个文件里面的字体竟然是一样的，只有编码不同，也就是说加密的字体只有这600多个三、woff转xml直接的woff文件python不好操作，先用fontTools转为xml文件from fo...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。