❝本文完整示例代码及文件已上传至
❞Github
仓库https://github.com/CNFeffery/PythonPracticalSkills
本期即将学习的是:快速提取字体子集。
![dc1cd1a2d00460d6f252ccc2fc8e728c.jpeg](https://img-blog.csdnimg.cn/img_convert/dc1cd1a2d00460d6f252ccc2fc8e728c.jpeg)
在我们日常进行数据可视化、web应用开发等场景中,经常会用到一些特殊的非系统自带字体,尤其是中文字体,由于包含的字符数量众多,因此体积一般都比较大,这在进行数据可视化读取字体文件,或是网页应用中通过网络加载字体文件时,就会带来更多的耗时。
而我们完全可以针对字体文件运用“按需引入”的思想,从原始的体积较大的全量字体文件中,根据我们实际使用到的文字范围,进行子集的提取,从而大幅度提升效率。
我们可以利用Python
中的fonttools
库来快捷实现此项需求,它由谷歌开源,自带了若干实用的字体处理相关命令行工具,使用pip install fonttools
安装完成后,我们只需要按照下列格式执行命令行工具pyftsubset
即可:
pyftsubset 原始字体文件路径 --text=需要保留的字符 --output-file=输出子集字体文件路径
而当我们需要进行保留的字符众多时,则可以通过书写Python
脚本的方式,批量拼接命令行进行模拟执行:
import os
import re
# 读入目标文本内容
with open('./将进酒.txt', encoding='utf-8') as t:
source_content = t.read()
# 模拟执行pyftsubset命令生成字体子集
os.system(
'pyftsubset 钟齐志莽行书.ttf --text={} --output-file=钟齐志莽行书mini.ttf'.format(
# 去除空白字符后去重
''.join(set(re.sub('\s', '', source_content)))
)
)
通过上面的示例代码,我们从本地原体积为4698kb
的字体文件中,提取出大小仅有76kb
的目标子集字体文件:
![20404c1c792492c69fa34d215398a3ce.png](https://img-blog.csdnimg.cn/img_convert/20404c1c792492c69fa34d215398a3ce.png)
在此基础上,我们就可以在项目中「大幅度」优化外部字体的使用效率😉,譬如下面的示例dash
应用(相关源码及文件已上传至文章开头仓库):
![e63cf5780f125c1cd3fb8aae14f7c337.png](https://img-blog.csdnimg.cn/img_convert/e63cf5780f125c1cd3fb8aae14f7c337.png)
本期分享结束,咱们下回见~👋
-------- End --------
推荐👇同名微信视频号
![2b4d4e030a64da10243ea762b54e0df8.jpeg](https://img-blog.csdnimg.cn/img_convert/2b4d4e030a64da10243ea762b54e0df8.jpeg)
图解Pandas
图文00-内容框架介绍 | 图文01-数据结构介绍 | 图文02-创建数据对象 | 图文03-操作Excel文件 | 图文04-常见的数据访问 | 图文05-常见的数据运算 | 图文06-常见的数学计算 | 图文07-常见的数据统计 | 图文08-常见的数据筛选 | 图文09-常见的缺失值处理 | 图文10-数据合并操作 | 图文11-Groupby分组操作
![3cd840cc5946d1400799a9c623312a02.jpeg](https://img-blog.csdnimg.cn/img_convert/3cd840cc5946d1400799a9c623312a02.jpeg)
![eea64aaee46ca970f6b87785108a6eb7.jpeg](https://img-blog.csdnimg.cn/img_convert/eea64aaee46ca970f6b87785108a6eb7.jpeg)