FreeType 基本约定

首发于我的个人博客:xie-kang.com
博客内有更多文章,欢迎大家访问
原文内容更全:原文地址

机器翻译,人工纠错,如有遗漏请见谅
转载请声明出处

官网英文原文:https://freetype.org/freetype2/docs/glyphs/index.html

1 基本印刷概念

1.1 字体文件、格式和信息

字体是一组可以被显示和打印的多样的字符映像,在单个字体中共享一些共有的特性,包括外表、风格、衬线等。按印刷领域的说法,它必须区别一个字体家族和多种字体外观,后者通常是从同样的模板而来,但是风格不同。例如,Palatino Regular和Palatino ltalic是两种不同的外观,但是属于同样的家族Palatino。
单个字体术语根据上下文既可以指家族也可指外观。例如,大多文字处理器的用户用字体指不同的字体家族,然而,大多这些家族根据它们的格式会通过多个数据文件实现。对于TrueType来讲,通常是每个外观一个文件(arial.ttf对应Arial Regular外观,ariali.ttf对应Arial ltalic外观)这个文件也叫字体,但是实际上只是一个字体外观。
数字字体是一个可以包含一个和多个字体外观的数据文件,它们每个都包含字符映像、字符度量,以及其他各种有关文木布局和特定字符编码的重要信息。对有些难用的格式,像Adobe的Typel,一个字体外观由几个文件描述(一个包含字符映象,一个包含字符度量等)。在这里我们忽略这种情况,只考虑一个外观一个文件的情况,不过在FT2.0(FreeType 2.0)中,能够处理多文件字体。
为了方便说明,一个包含多个外观的字体文件我们叫做字体集合,这种情况不多见,但是多数亚洲字体都是如此,它们会包含两种或多种表现形式的映像,例如横向和纵向布局。

1.2 字符映象和图

字符映象叫做字形,根据书写、用法和上下文,单个字符能够有多个不同的映象,即多个字形。多个字符也可以有一个字形(例如Roman)。字符和字形之间的关系可能是非常复杂,本文不多述。而且,多数字体格式都使用不太难用的方案存储和访问字形。为了清晰的原因,当说明FT时,保持下而的观念:

  • 一个字体文件包含一组字形,每个字形可以存成位图、向量表示或其他结构(可缩放的格式使用一种数学表示和控制数据/程序的结合方式)。这些字形可以以任意顺序存在字体文件中,通常通过一个简单的字形索引访问。

  • 字体文件包含一个或多个表,叫做字符图,用来为某种字符编码将字符码转换成字形索引,例如ASCII、Unicode、Big5等等:单个字体文件可能包含多个字符图,例如大多TrueType字体文件都会包含一个Apple特定的字符图和Unicode字符图,使它在Mac和Windows平台都可以使用。

1.3 字符和字体度量

每个字符映象都关联多种度量,被用来在渲染文本时,描述如何放置和管理它们。在后面会有详述,它们和字形位置、光标步进和文本布局有关。它们在渲染一个文本串时计算文本流时非常重要。

每个可缩放的字体格式也包含一些全局的度量,用概念单位表示,描述同一种外观的所有字形的一些特性,例如最大字形外框,字体的上行字符、下行字符和文本高度等。虽然这些度量也会存在于一些不可缩放格式,但它们只应用于一组指定字符维度和分辨率,并且通常用
象素表示。

2 字形轮廓

2.1 象素、点和设备解析度

当处理计算机图形程序时,指定象素的物理尺寸不是正方的。通常,输出设备是屏幕或打印机,在水平和垂直方向都有多种分辨率,当渲染文木是要注意这些情况。定义设各的分辨率通常使用用dpi(每英寸点(dot)数)表示的两个数,例如,一个打印机的分辨率为300x60dpi表示在水平方向,每英寸有300个象素,在垂直方向有600个象素。一个典型的计算机显示器根据它的大小,分辨率不同(15’‘,和17’'显示器对640x480象素大小不同),当然图形模式分辨率也不一样。

所以,文本的大小通常用点(point,所谓的pt单位)表示,而不是用设备特定的象素。点是一种简单的物理单位,在数字印刷中,一点等于1/72英寸。例如,大多罗马书籍使用10到14点大小印刷文字内容。

可以用点数大小来计算象素数,公式如下:象素数=点数*分辨率/72

分辨率用dpi表示,因为水平和垂直分辨率可以不同,单个点数通常定义不同象素文本宽度和高度。

2.2向量表示

字体轮廓的源格式是一组封闭的路径,叫做轮廓线。每个轮廓线划定字形的外部或内部区域,它们可以是线段或是Bezier曲线。

曲线通过控制点定义,根据字体格式,可以是二次(conicBeziers)或三次(cubicBeziers)多项式。在文献中,conic Bezier通常称为quadrati Beziers。因此,轮廓中每个点都有一个标志表示它的类型是一般还是控制点,缩放这些点将缩放整个轮廓。

每个字形最初的轮廓点放置在一个不可分割单元的网格中,点通常在字体文件中以16位整型网格坐标存储,网格的原点在(0,0),它的范围是-32768到32767。(虽然有的格式如Typel使用浮点型,但为简便起见,我们约定用整型分析)。

网格的方向和传统数学二维平面一致,x轴从左到右,y轴从下到上。

在创建字形轮廓时,一个字体设计者使用一个假想的正方形,叫做EM正方形。它可以想象成一个画字符的平面。正方形的大小,即它边长的网格单元是很重要的,原因是:

  • 它是用来将轮廓缩放到指定文本尺寸的参考,例如在300x300dpi中的12pt大小对应12x300/72=50象素。从网格单元缩放到象素可以使用下面的公式:
    象素数=点数×分辨率/72;
    象素坐标=网格坐标*象素数/EM大小;

  • EM尺寸越大,则可以达到更大的分辨率,例如一个极端的例子,一个4单元的EM,只有25个点位置,显然不够,通常TrueType字体用的是2048单元的EM。Typel PostScript字体有一个同定1000网格单元的EM,但是点坐标可以用浮点值表示。

注意,字形可以自由超出EM正方形。网格单元通常交错字体单元或EM单元。上边的象素数并不是指实际字符的大小,而是EM正方形显示的大小,所以不同字体,虽然同样大小,但是它们的高度可能不同。

2.3 Hinting和位图渲染

存储在一个字体文件中的轮廓叫“主”轮廓,它的点坐标用字体单元表示,在它被转换成一个位图时,它必须缩放至指定大小。这通过一个简单的转换完成,但是总会产生一些不想要的副作用,例如像字母E和H,它们主干的宽度和高度会不相同。

所以,优秀的字形渲染过程在缩放“点”是,需要通过一个网格对齐(grid-fitting)的操作(通常叫hinting),将它们对齐到目标设备的象素网格。这主要目的之一是为了确保整个字体中,重要的宽度和高度能够一致。例如对于字符I和T来说,它们那个垂直笔划要保持同样象素宽度。另外,它的目的还有管理如stem和overshot的特性,这在小象素字体会引起一些问题。

有若十种方式来处理网格对齐,多数可缩放格式中,每种字形轮廓都有一些控制数据和程序。

  • 显式网格对齐
    TlueType格式定义了一个基于栈的虚拟机(VM),可以借助多于200种操作码(大多是几何操作)来编写程序,每个字形都山一个轮廓和一个控制程序组成,后者可以处理实际的网格对齐,它由字体设计者定义。采用显式的方式,质量上,对小字体有很好的结果,这对屏幕显示非常重要;速度上,如果程序很复杂,解释字节码很慢;一致性上,所有渲染器产生同样的字形位图;大小上,字形程序会很长:技术难度上,编写优
    秀的hinting程序非常难,没有好的工具支持。

  • 隐式网格对齐(也叫hinting)
    TypeI格式有一个更简单的方式,每个字形由一个轮廓以及若干叫hints的片断组成,后者用来描述字形的某些重要特性,例如主干的存在、某些宽度匀称性等诸如此类。没有多少种hint,要看渲染器如何解释hint来产生一个对齐的轮廓。大小:Hint通常比显式字形程序小的多;质量:小字体不好,最后结合反走样;速度:网格对齐会非常快;不一致:不同渲染器结果不同,只至同一引擎不同版木也不同。

  • 自动网格对齐
    有些格式很简单,没有包括控制信息,将字体度量如步进、宽度和高度分开。要靠渲染器来猜测轮廓的一些特性来实现得体的网格对齐。大小:不需要控制信息,导致更小的字体文件;质量:小字体不好,最后结合反走样;速度:依赖对齐算法,通常比显式对齐快。速度:依賴算法;不一致:不同渲染器结果不同,甚至同一引擎不同版本也不同。

3 字形度量

3.1 基线(baseline)、笔(pen)和布局(layout)

基线是一个假想的线,用来在渲染文本时知道字形,它可以是水平(如Roman)和是垂直的(如垂直印刷的中文)。而且,为了渲染文木,在基线上有一个虚拟的点,叫做笔位置(pen position)或原点(origin),它用来定位字形。每种布局使用不同的规约来放置字形:

  • 对水平布局,字形简单地搁在基线上,通过增加笔位置来渲染文木,可以向右也可以向左增加。两个相邻笔位置之间的距离是根据字形不同的,叫做步进宽度(advance width)。注意这个值总是正数,即使是从右往左的方向排列字符,如Arabic。这和文本渲染的方式有些不同。笔位置总是放置在基线上。
    !外链图片!
  • 对垂直布局,字形在基线上居中放置:
    !外链图片!

3.2 印刷度量和边界框

在指定字体中,定义了多种外观度量。

  • 上行高度(ascent)。从基线到放置轮廓点最高/上的网格坐标,因为Y轴方向是向上的,所以它是一个正值。

  • 下行高度(descent)。从基线到放置轮廓点最低/下的网格坐标,因为Y轴方向是向上的,所以它是一个负值。

  • 行距(linegap)。两行文本间必须的距离,基线到基线的距离应该计算成:
    上行高度一下行高度+行距

  • 边界框(bounding box,bbox)。这是一个假想的框子,它尽可能紧密的装入字形。通过四个值来表示,叫做xMin、yMin、xMax、yMax,对任何轮廓都可以计算,它们可以是字体单元(测量原始轮廓)或者整型象素单元(测量己缩放的轮廓)。注意,如果不是为了网格对齐,你无需知道这个框子的这个值,只需知道它的大小即可。但为了正确渲染一个对齐的字形,需要保存每个字形在基线上转换、放置的重要对齐。

  • 内部leading。这个蟹念从传统印刷业而来,他表示字形出了EM正方形空间数礼通常计算如下:

    internal leading = ascent - descent - EM_size

  • 外部leading。行距的别名。

3.3 跨距(bearing)和步进

每个字形都有叫跨距和步进的距离,它们的定义是常量,但是它们的值依赖布局,同样的字形可以用来渲染稹向或纵向文字。

  • 左跨距或bearingX。从当前笔位置到字形左bbox边界的水平距离,对水平布局是正数,对垂直布局大多是负值。

  • 上跨距或bearingY。从基线到bbox上边界的垂直距离,对水平布局是正值,对垂直布局是负值。

  • 步进宽度或advanceX。当处理文木渲染一个字形后,笔位置必须增加(从左向右)或减少(从右向左)的水平距离。对水平布局总是正值,垂直布局为null。

  • 步进高度或advanceY当每个字形渲染后,笔位置必须减少的垂直距离。对水平布局为null,对垂直布局总是正值。

  • 字形宽度。字形的水平长度。对未缩放的字体坐标,它是bbox.xMax-bbox.xMin,对己缩放字形,它的计算要看特定情况,视乎不同的网格对齐而定。

  • 字形高度。字形的垂直长度。对未缩放的字体坐标,它是bbox.yMax-bbox.yMin,对己缩放字形,它的计算要看特定情况,视乎不同的网格对齐而定。

  • 右跨距。只用于水平布局,描述从bbox右边到步进宽度的距离,通常是一个非负值。
    advance_width - left_side_bearing - (xMax - xMin)

下图是水平布局所有的度量
!外链图片!
下图是垂直布局所有的度量
!外链图片!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值