利用Python快速提取字体子集

最新推荐文章于 2024-04-27 15:14:44 发布

Python数据之道

最新推荐文章于 2024-04-27 15:14:44 发布

阅读量247

点赞数

文章标签： python 开发语言

原文链接：https://mp.weixin.qq.com/s?__biz=MzI2NjY5NzI0NA==&mid=2247514081&idx=1&sn=51ec4341519b46a638c03ab1621718c3&chksm=ea88d892ddff5184860e50df8b16107de64a92c4d705533e6af1b12e7bf358b6b14d0ed6d741&scene=126&sessionid=0

版权

❝
本文完整示例代码及文件已上传至Github仓库https://github.com/CNFeffery/PythonPracticalSkills
❞

本期即将学习的是：快速提取字体子集。

在我们日常进行数据可视化、web应用开发等场景中，经常会用到一些特殊的非系统自带字体，尤其是中文字体，由于包含的字符数量众多，因此体积一般都比较大，这在进行数据可视化读取字体文件，或是网页应用中通过网络加载字体文件时，就会带来更多的耗时。

而我们完全可以针对字体文件运用“按需引入”的思想，从原始的体积较大的全量字体文件中，根据我们实际使用到的文字范围，进行子集的提取，从而大幅度提升效率。

我们可以利用Python中的fonttools库来快捷实现此项需求，它由谷歌开源，自带了若干实用的字体处理相关命令行工具，使用pip install fonttools安装完成后，我们只需要按照下列格式执行命令行工具pyftsubset即可：

pyftsubset 原始字体文件路径 --text=需要保留的字符 --output-file=输出子集字体文件路径

而当我们需要进行保留的字符众多时，则可以通过书写Python脚本的方式，批量拼接命令行进行模拟执行：

import os
import re

# 读入目标文本内容
with open('./将进酒.txt', encoding='utf-8') as t:
    source_content = t.read()
    
# 模拟执行pyftsubset命令生成字体子集
os.system(
    'pyftsubset 钟齐志莽行书.ttf --text={} --output-file=钟齐志莽行书mini.ttf'.format(
        # 去除空白字符后去重
        ''.join(set(re.sub('\s', '', source_content)))
    )
)

通过上面的示例代码，我们从本地原体积为4698kb的字体文件中，提取出大小仅有76kb的目标子集字体文件：

在此基础上，我们就可以在项目中「大幅度」优化外部字体的使用效率😉，譬如下面的示例dash应用（相关源码及文件已上传至文章开头仓库）：

本期分享结束，咱们下回见~👋

-------- End --------

推荐👇同名微信视频号

图解Pandas

Python数据之道

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用Python快速提取字体子集

❝本文完整示例代码及文件已上传至Github仓库https://github.com/CNFeffery/PythonPracticalSkills❞本期即将学习的是：快速提取字体子集。在我们日常进行数据可视化、web应用开发等场景中，经常会用到一些特殊的非系统自带字体，尤其是中文字体，由于包含的字符数量众多，因此体积一般都比较大，这在进行数据可视化读取字体文件，或是网页应用中通过网络加载字体文件...
复制链接

扫一扫