手写识别暂且可以理解为:一个jpg格式,然后转换为txt格式,这里普遍用01来替代。
先附上代码,以后可以自己构建此类数据集
jpg格式转txt格式:(代码的核心思想是如何求出对应灰度值后填充自己规定的ascii_char)
from PIL import Image
import argparse
ascii_char = '01'
def select_ascii_char(r, g, b):
gray = int((19595 * r + 38469 * g + 7472 * b) >> 16)
unit = 256.0/len(ascii_char)
return ascii_char[int(gray/unit)]
def preimg(img_name, width = 100, height = 100):
img = Imag