用python输出汉字字库问题1:假设我们知道汉字编码范围是0x4E00到0x9FA5,怎么从十六进制的编码转成人类可读的字呢?
问题2:怎么把unicode编码的字写入文件呢,如果直接用open()的话,会提示UnicodeEncodeError: ‘ascii’ codec can’t encode character u’u4e00′ in position 0: ordinal not in range(128)
问题1的答案是用unichr,问题2的答案是用codecs。
下面上代码。
import codecs
start,end = (0x4E00, 0x9FA5)
with codecs.open("chinese.txt", "wb", encoding="utf-8") as f:
for codepoint in range(int(start),int(end)):
f.write(unichr(codepoint))
打开chinese.txt文件,截图如下

用python将文本转图片字库上面提到怎么得到汉字字库,下面就来讲怎么把一个一个的字转成图片,这在机器学习中会有用处。
一句话,用pygame渲染文字到图片上。
下面上代码。
import os
import pygame
chinese_dir = 'chinese'
if not os.path.exists(chinese_dir):
os.mkdir(chinese_dir)
pygame.init()
start,end = (0x4E00, 0x9FA5)#汉字编码范围
for codepoint in range(int(start),int(end)):
word = unichr(codepoint)
font = pygame.font.Font("msyh.ttc", 22)#当前目录下要有微软雅黑的字体文件msyh.ttc,或者去c:WindowsFonts目录下找
rtext = font.render(word, True, (0, 0, 0), (255, 255, 255))
pygame.image.save(rtext, os.path.join(chinese_dir,word+".png"))
下面是效果截图。

您可能感兴趣的文章:Python3实现获取图片文字里中文的方法分析python使用PIL给图片添加文字生成海报示例Python之文字转图片方法python 识别图片中的文字信息方法Python3一行代码实现图片文字识别的示例利用Python自带PIL库扩展图片大小给图片加文字描述的方法示例Python在图片中添加文字的两种方法使用Python脚本将文字转换为图片的实例分享Python在图片中插入大量文字并且自动换行
本文介绍了如何使用Python从汉字编码范围生成汉字字库,并将其写入文件,解决Unicode编码问题。此外,还展示了如何利用pygame将汉字转为图片,适用于机器学习中的文字处理。通过创建一个包含所有汉字的txt文件,然后用pygame将每个汉字渲染为图片,保存为png格式。

221

被折叠的 条评论
为什么被折叠?



