FreeType 基本约定_freetype ascent-CSDN博客

本文链接：https://blog.csdn.net/qq_17301261/article/details/127575458

首发于我的个人博客：xie-kang.com
博客内有更多文章，欢迎大家访问
原文内容更全：原文地址

机器翻译，人工纠错，如有遗漏请见谅
转载请声明出处

官网英文原文：https://freetype.org/freetype2/docs/glyphs/index.html

1 基本印刷概念

1.1 字体文件、格式和信息

字体是一组可以被显示和打印的多样的字符映像，在单个字体中共享一些共有的特性，包括外表、风格、衬线等。按印刷领域的说法，它必须区别一个字体家族和多种字体外观，后者通常是从同样的模板而来，但是风格不同。例如，Palatino Regular和Palatino ltalic是两种不同的外观，但是属于同样的家族Palatino。
单个字体术语根据上下文既可以指家族也可指外观。例如，大多文字处理器的用户用字体指不同的字体家族，然而，大多这些家族根据它们的格式会通过多个数据文件实现。对于TrueType来讲，通常是每个外观一个文件（arial.ttf对应Arial Regular外观，ariali.ttf对应Arial ltalic外观）这个文件也叫字体，但是实际上只是一个字体外观。
数字字体是一个可以包含一个和多个字体外观的数据文件，它们每个都包含字符映像、字符度量，以及其他各种有关文木布局和特定字符编码的重要信息。对有些难用的格式，像Adobe的Typel，一个字体外观由几个文件描述（一个包含字符映象，一个包含字符度量等）。在这里我们忽略这种情况，只考虑一个外观一个文件的情况，不过在FT2.0(FreeType 2.0)中，能够处理多文件字体。
为了方便说明，一个包含多个外观的字体文件我们叫做字体集合，这种情况不多见，但是多数亚洲字体都是如此，它们会包含两种或多种表现形式的映像，例如横向和纵向布局。

1.2 字符映象和图

字符映象叫做字形，根据书写、用法和上下文，单个字符能够有多个不同的映象，即多个字形。多个字符也可以有一个字形（例如Roman）。字符和字形之间的关系可能是非常复杂，本文不多述。而且，多数字体格式都使用不太难用的方案存储和访问字形。为了清晰的原因，当说明FT时，保持下而的观念：

一个字体文件包含一组字形，每个字形可以存成位图、向量表示或其他结构（可缩放的格式使用一种数学表示和控制数据/程序的结合方式）。这些字形可以以任意顺序存在字体文件中，通常通过一个简单的字形索引访问。
字体文件包含一个或多个表，叫做字符图，用来为某种字符编码将字符码转换成字形索引，例如ASCII、Unicode、Big5等等：单个字体文件可能包含多个字符图，例如大多TrueType字体文件都会包含一个Apple特定的字符图和Unicode字符图，使它在Mac和Windows平台都可以使用。

1.3 字符和字体度量

每个字符映象都关联多种度量，被用来在渲染文本时，描述如何放置和管理它们。在后面会有详述，它们和字形位置、光标步进和文本布局有关。它们在渲染一个文本串时计算文本流时非常重要。

每个可缩放的字体格式也包含一些全局的度量，用概念单位表示，描述同一种外观的所有字形的一些特性，例如最大字形外框，字体的上行字符、下行字符和文本高度等。虽然这些度量也会存在于一些不可缩放格式，但它们只应用于一组指定字符维度和分辨率，并且通常用
象素表示。

2 字形轮廓

2.1 象素、点和设备解析度

当处理计算机图形程序时，指定象素的物理尺寸不是正方的。通常，输出设备是屏幕或打印机，在水平和垂直方向都有多种分辨率，当渲染文木是要注意这些情况。定义设各的分辨率通常使用用dpi（每英寸点(dot)数）表示的两个数，例如，一个打印机的分辨率为300x60dpi表示在水平方向，每英寸有300个象素，在垂直方向有600个象素。一个典型的计算机显示器根据它的大小，分辨率不同（15’‘，和17’'显示器对640x480象素大小不同），当然图形模式分辨率也不一样。

所以，文本的大小通常用点(point，所谓的pt单位)表示，而不是用设备特定的象素。点是一种简单的物理单位，在数字印刷中，一点等于1/72英寸。例如，大多罗马书籍使用10到14点大小印刷文字内容。

可以用点数大小来计算象素数，公式如下：象素数=点数*分辨率/72

分辨率用dpi表示，因为水平和垂直分辨率可以不同，单个点数通常定义不同象素文本宽度和高度。

2.2向量表示

字体轮廓的源格式是一组封闭的路径，叫做轮廓线。每个轮廓线划定字形的外部或内部区域，它们可以是线段或是Bezier曲线。

曲线通过控制点定义，根据字体格式，可以是二次(conicBeziers)或三次(cubicBeziers)多项式。在文献中，conic Bezier通常称为quadrati Beziers。因此，轮廓中每个点都有一个标志表示它的类型是一般还是控制点，缩放这些点将缩放整个轮廓。

每个字形最初的轮廓点放置在一个不可分割单元的网格中，点通常在字体文件中以16位整型网格坐标存储，网格的原点在（0，0），它的范围是-32768到32767。（虽然有的格式如Typel使用浮点型，但为简便起见，我们约定用整型分析)。

网格的方向和传统数学二维平面一致，x轴从左到右，y轴从下到上。

在创建字形轮廓时，一个字体设计者使用一个假想的正方形，叫做EM正方形。它可以想象成一个画字符的平面。正方形的大小，即它边长的网格单元是很重要的，原因是：

它是用来将轮廓缩放到指定文本尺寸的参考，例如在300x300dpi中的12pt大小对应12x300/72=50象素。从网格单元缩放到象素可以使用下面的公式:
象素数=点数×分辨率/72;
象素坐标=网格坐标*象素数/EM大小;
EM尺寸越大，则可以达到更大的分辨率，例如一个极端的例子，一个4单元的EM，只有25个点位置，显然不够，通常TrueType字体用的是2048单元的EM。Typel PostScript字体有一个同定1000网格单元的EM，但是点坐标可以用浮点值表示。

注意，字形可以自由超出EM正方形。网格单元通常交错字体单元或EM单元。上边的象素数并不是指实际字符的大小，而是EM正方形显示的大小，所以不同字体，虽然同样大小，但是它们的高度可能不同。

2.3 Hinting和位图渲染

存储在一个字体文件中的轮廓叫“主”轮廓，它的点坐标用字体单元表示，在它被转换成一个位图时，它必须缩放至指定大小。这通过一个简单的转换完成，但是总会产生一些不想要的副作用，例如像字母E和H，它们主干的宽度和高度会不相同。

所以，优秀的字形渲染过程在缩放“点”是，需要通过一个网格对齐(grid-fitting)的操作（通常叫hinting)，将它们对齐到目标设备的象素网格。这主要目的之一是为了确保整个字体中，重要的宽度和高度能够一致。例如对于字符I和T来说，它们那个垂直笔划要保持同样象素宽度。另外，它的目的还有管理如stem和overshot的特性，这在小象素字体会引起一些问题。

有若十种方式来处理网格对齐，多数可缩放格式中，每种字形轮廓都有一些控制数据和程序。

显式网格对齐
TlueType格式定义了一个基于栈的虚拟机(VM)，可以借助多于200种操作码（大多是几何操作）来编写程序，每个字形都山一个轮廓和一个控制程序组成，后者可以处理实际的网格对齐，它由字体设计者定义。采用显式的方式，质量上，对小字体有很好的结果，这对屏幕显示非常重要；速度上，如果程序很复杂，解释字节码很慢；一致性上，所有渲染器产生同样的字形位图；大小上，字形程序会很长：技术难度上，编写优
秀的hinting程序非常难，没有好的工具支持。
隐式网格对齐（也叫hinting）
TypeI格式有一个更简单的方式，每个字形由一个轮廓以及若干叫hints的片断组成，后者用来描述字形的某些重要特性，例如主干的存在、某些宽度匀称性等诸如此类。没有多少种hint，要看渲染器如何解释hint来产生一个对齐的轮廓。大小：Hint通常比显式字形程序小的多；质量：小字体不好，最后结合反走样；速度：网格对齐会非常快；不一致：不同渲染器结果不同，只至同一引擎不同版木也不同。
自动网格对齐
有些格式很简单，没有包括控制信息，将字体度量如步进、宽度和高度分开。要靠渲染器来猜测轮廓的一些特性来实现得体的网格对齐。大小：不需要控制信息，导致更小的字体文件；质量：小字体不好，最后结合反走样；速度：依赖对齐算法，通常比显式对齐快。速度：依賴算法；不一致：不同渲染器结果不同，甚至同一引擎不同版本也不同。

3 字形度量

3.1 基线（baseline）、笔(pen)和布局(layout)

基线是一个假想的线，用来在渲染文本时知道字形，它可以是水平（如Roman)和是垂直的（如垂直印刷的中文）。而且，为了渲染文木，在基线上有一个虚拟的点，叫做笔位置（pen position）或原点（origin），它用来定位字形。每种布局使用不同的规约来放置字形：

对水平布局，字形简单地搁在基线上，通过增加笔位置来渲染文木，可以向右也可以向左增加。两个相邻笔位置之间的距离是根据字形不同的，叫做步进宽度（advance width)。注意这个值总是正数，即使是从右往左的方向排列字符，如Arabic。这和文本渲染的方式有些不同。笔位置总是放置在基线上。
!外链图片!
对垂直布局，字形在基线上居中放置：
!外链图片!

3.2 印刷度量和边界框

在指定字体中，定义了多种外观度量。

上行高度（ascent）。从基线到放置轮廓点最高/上的网格坐标，因为Y轴方向是向上的，所以它是一个正值。
下行高度（descent)。从基线到放置轮廓点最低/下的网格坐标，因为Y轴方向是向上的，所以它是一个负值。
行距(linegap)。两行文本间必须的距离，基线到基线的距离应该计算成：
上行高度一下行高度+行距
边界框（bounding box，bbox）。这是一个假想的框子，它尽可能紧密的装入字形。通过四个值来表示，叫做xMin、yMin、xMax、yMax，对任何轮廓都可以计算，它们可以是字体单元（测量原始轮廓）或者整型象素单元（测量己缩放的轮廓)。注意，如果不是为了网格对齐，你无需知道这个框子的这个值，只需知道它的大小即可。但为了正确渲染一个对齐的字形，需要保存每个字形在基线上转换、放置的重要对齐。
内部leading。这个蟹念从传统印刷业而来，他表示字形出了EM正方形空间数礼通常计算如下：

internal leading = ascent - descent - EM_size
外部leading。行距的别名。

3.3 跨距（bearing）和步进

每个字形都有叫跨距和步进的距离，它们的定义是常量，但是它们的值依赖布局，同样的字形可以用来渲染稹向或纵向文字。

左跨距或bearingX。从当前笔位置到字形左bbox边界的水平距离，对水平布局是正数，对垂直布局大多是负值。
上跨距或bearingY。从基线到bbox上边界的垂直距离，对水平布局是正值，对垂直布局是负值。
步进宽度或advanceX。当处理文木渲染一个字形后，笔位置必须增加（从左向右）或减少（从右向左）的水平距离。对水平布局总是正值，垂直布局为null。
步进高度或advanceY当每个字形渲染后，笔位置必须减少的垂直距离。对水平布局为null，对垂直布局总是正值。
字形宽度。字形的水平长度。对未缩放的字体坐标，它是bbox.xMax-bbox.xMin，对己缩放字形，它的计算要看特定情况，视乎不同的网格对齐而定。
字形高度。字形的垂直长度。对未缩放的字体坐标，它是bbox.yMax-bbox.yMin，对己缩放字形，它的计算要看特定情况，视乎不同的网格对齐而定。
右跨距。只用于水平布局，描述从bbox右边到步进宽度的距离，通常是一个非负值。
advance_width - left_side_bearing - (xMax - xMin）