根据ttf风格字体生成2W+中文字大全，白底黑字

本文链接：https://blog.csdn.net/qq_51831335/article/details/137504302

字体示例1

字体示例2

字体示例3

生成的过程中，问题还是挺多的，比如文字不存在，就会生产出来全白色的图片，这需要删掉！

还有可能会生成非常小的，需要调节尺寸

整体目录格式如下：

fontStylePackage放入ttf格式文件，便可以自动读取进行字体生成。

train生成数据放的地方

ALLwords.txt 下面有获取方式

genTrainData.py 生成字体代码如下；

import string
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
import tqdm

def draw_text_with_font(font_path, text, image=None, write=False):
    # 设置图像大小和背景色
    iw, ih = 5, 5
    thre = 16
    image = np.ones((iw*thre, ih*thre, 3), np.uint8) * 255  # 将图像放大一倍

    # 加载TTF字体文件
    font = ImageFont.truetype(font_path, 72)  # 将字体大小调大

    # 创建PIL图像对象
    pil_image = Image.fromarray(image)
    draw = ImageDraw.Draw(pil_image)

    # 计算文本绘制位置
    text_width, text_height = draw.textsize(text, font)
    x = (image.shape[1] - text_width) // 2
    y = (image.shape[0] - text_height) // 2 

    # 绘制文本
    draw.text((x, y), text, font=font, fill='black')

    # 将PIL图像转换为OpenCV格式
    cv_image = cv2.cvtColor(np.array(pil_image), cv2.COLOR_RGB2BGR)

    # 将图像缩小回原始大小
    cv_image = cv2.resize(cv_image, (ih*thre, iw*thre))

    # 保存图像
    if write:
        # cv2.imwrite('seeStyle{}.png'.format(font_path.split('\\')[-1].split('.')[0]), cv_image)
        cv2.imshow('1', cv_image)
        cv2.waitKey(0)
    return cv_image

def cuter_word(styleImage, ocr):
        
    result = ocr.ocr(styleImage)
    for line in result:
        for idx, word_info in enumerate(line):
            xbox = word_info[0]
            # 提取x和y坐标
            x_coords = [point[0] for point in xbox]
            y_coords = [point[1] for point in xbox]
            thre = 0
            x_min = max(int(min(x_coords)) - thre, 0)  
            y_min = max(int(min(y_coords) - thre), 0)
            x_max = int(max(x_coords))
            y_max = int(max(y_coords))
            styleImage = styleImage[y_min:y_max, x_min:x_max]
    return styleImage
    

def draw_font(idx, jdx,  font_path, text, write=False):
    cv_image = draw_text_with_font(font_path, text)
    # 保存图像
    # print(idx, jdx, text)
    fontPath = 'train/character{}'.format(idx)
    if not os.path.exists(fontPath):
        os.makedirs(fontPath)

    im = cv2.cvtColor(cv_image, cv2.COLOR_BGR2GRAY)
    if write and cv2.countNonZero(im)!=6400:
        cv2.imwrite(os.path.join(fontPath, jdx+'.png'), cv_image)
    
    return cv_image

if __name__ == '__main__':
    # 调用函数并传入TTF字体文件路径和文本信息
    import os 
    # 逐行写入到Txt文件
    fontStyle = os.listdir("fontStylePackage")
    fonts = []
    with open('ALLwords.txt', 'r', encoding='utf-8') as file:
        for line in file.readlines():
            fonts.append(str(line).strip('\n'))
    print(fonts)
    for idx, fs in enumerate(fontStyle):
        font_path = os.path.join('fontStylePackage/', fs)
        print("第"+str(idx) + "种类的风格字体正在生成中。。。 ")
        for jdx, text in enumerate(tqdm.tqdm(fonts)):
            text = text[-1]
            draw_font(str(idx), str(jdx), font_path, text, write=True)

给出字体txt文件，里面包含了2W多个字体，简体字繁体字中文汉字大全，如果不存在的话可以根据以下函数除去生成的空白图片。

链接：https://pan.baidu.com/s/1sr-IQIHGfuFODNSaIDf2Bw
提取码：87k3
--来自百度网盘超级会员V4的分享

def delWithoutWord(image):
    cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    if cv2.countNonZero(im)==6400:
        return True 图片全白
    return False # 图片非全白

运行截图