在OCR识别、检测的数据生成过程当中,我们经常会需要利用字体生成汉字的图片,在Python当中,这一部分的操作通常是通过Pillow 模块提供的ImageFont 模块来完成,下面我们用一个例子,介绍这个模块基本的使用方法:
1、建立一个字体对象
首先,我们需要通过ImageFont.truetype 建立一个字体对象:
# import 字体相关三件套
from PIL import ImageFont, Image, ImageDraw
# 生成font
ttf_path = '/xxx.ttf'
text_size = 40 # text_size 是字号
font = ImageFont.truetype(ttf_path, text_size)
通过这个这个对象,我们可以获取一个字体当中存储的每个字符的相关信息:
2、通过font 获取字符相关信息
2.1 基本的区域信息
font 对象一般来说比较常用的两个方法为:
这两对数字是什么意思呢?
我们以下面这张图当中的’一’ 为例,我们知道,将一个‘一’画在屏幕上基本需要知道两个信息:
1、要用多大的一个“格子”来画‘一’,这就对应着上述的getsize,需要一个宽300,高256的画布才能画出这个 ‘一’
2、我们知道,汉字一般会在书写的时候,上下留出一些空间,所以如下图,如果黑框内为汉字实际的内容,则我们需要以左上角为起点,x轴偏移0个单位,y轴偏移117个单位才能画出这个'一',这就对应着 font.getoffset('一')
2.2 获取更加详细的信息
在2.1 中,我们已经获取了字体的一般信息,但是事实上ImageFont 还提供给了我们更加详细的信息供我们使用:
3、绘制图片
有了上述的了解,我们就可以绘制图片了:
绘制一般使用ImageDraw 这个类,一般的绘制是没有问题的:
但如果希望能够绘制一个完全包络汉字,不留周围空白的图片,就会稍微复杂一些: