用python输出汉字字库

最新推荐文章于 2023-02-20 17:42:58 发布

原创最新推荐文章于 2023-02-20 17:42:58 发布 · 8.8k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#字库 #编码 #codec

Python 专栏收录该内容

128 篇文章

订阅专栏

本文介绍如何将汉字的Unicode编码转换为可读字符，并演示如何使用Python的`unichr`函数进行转换，以及如何利用`codecs`模块将这些字符正确地写入文件中。

部署运行你感兴趣的模型镜像

问题1：假设我们知道汉字编码范围是0x4E00到0x9FA5，怎么从十六进制的编码转成人类可读的字呢？

问题2：怎么把unicode编码的字写入文件呢，如果直接用open()的话，会提示UnicodeEncodeError: 'ascii' codec can't encode character u'\u4e00' in position 0: ordinal not in range(128)

问题1的答案是用unichr，问题2的答案是用codecs。

下面上代码。

import codecs
start,end = (0x4E00, 0x9FA5)
with codecs.open("chinese.txt", "wb", encoding="utf-8") as f:
    for codepoint in range(int(start),int(end)):
        f.write(unichr(codepoint))

打开chinese.txt文件，截图如下

您可能感兴趣的与本文相关的镜像

Python3.11

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mattkang

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python开源的字体解析库FreeType

zhangzhechun的专栏

07-07

1809

FreeType是一个开源的字体解析库。它主要用于解析TrueType字体和OpenType字体,并为它们提供渲染功能。所以使用freetype-py,我们能方便地在Python项目中使用各种TrueType和OpenType字体。freetype-py为Python提供了一个面向对象的API,可以方便地使用字体解析和渲染功能。它通过freetype解析SimHei.ttf字体,然后使用解析信息在图中渲染中文字。Python提供了freetype-py库,为freetype提供Python绑定。

Python3 Opencv中文输出：使用Opencv将中文字符进行图像化输出

最新发布

weixin_50547796的博客

06-14

342

其实就是将每个字符按照一定的规则转换成一个矩阵，每个元素代表这个字符在该位置上应该显示的像素值。常用的方法是使用字库，将每个字符对应到一个位图上，然后读取位图的像素值作为字符的矩阵表示。但是对于中文字符的输出，特别是在中文环境下运行程序时，常常会出现乱码问题。本文将介绍如何使用Opencv实现中文字符的图像化输出，并解决中文字符乱码问题。在Opencv中，图像被表示为一个矩阵，每个元素代表像素点的亮度值。在中文环境下，Opencv默认使用的字体不支持中文字符，因此会出现乱码问题。这里使用的是宋体字体文件。

1 条评论您还未登录，请先登录后发表或查看评论

python字库转文字图片_python生成汉字图片字库

weixin_39809584的博客

12-03

267

修改后的代码：# 导入必要的模块import pygameimport Imageimport StringIO,os#打开文件，读取文件内容f = open('word.txt','r')words = f.readlines()[0].strip()f.close()def pasteWord(words):'''定义一个渲染文字的函数'''# 初始化pygame，并加载字体os.chdir(...

对Python生成汉字字库文字,以及转换为文字图片的实例详解

01-21

笔者小白在收集印刷体汉字的深度学习训练集的时候，一开始就遇到的了一个十分棘手的问题，就是如何获取神经网络的训练集数据。通过上网搜素，笔者没有找到可用的现成的可下载的汉字的训练集，于是笔者采用了代码自建汉字的训练集数据。这里采用的是python编写程序，需要import 的python库请提前安装。那么，首先如何用python输出汉字字库的文字？笔者查到在计算机中汉字编码范围是0x4E00到0x9FA5，利用unichr（）可以将十六进制的编码转成人类可读的字。这里扩展一下在python库中什么是unichr（），以及什么是chr（）和ord（）。 chr( )函数用一个范围在range

python HZK16字库使用

鹤九日的博客

02-20

1635

python HZK16字库的使用

python语言怎么输入-python/基础输出输入用法

weixin_37988176的博客

11-01

994

输出及输入的简单用法printprint，中文意思是打印，在python里它不是往纸上打印，而是打印在命令行，或者叫终端、控制台里面。print是python里很基本很常见的一个操作，它的操作对象是一个字符串（什么是字符串，此处按住不表，且待日后慢慢道来）。基本格式是： print 你要打印的东西或者 print(你要打印的东西)这里一定要英文字符的括号，所有程序中出现的符号都必须是英文字符，注意...

Python输出汉字字库及将文字转换为图片的方法

01-20

用python输出汉字字库问题1：假设我们知道汉字编码范围是0x4E00到0x9FA5，怎么从十六进制的编码转成人类可读的字呢？问题2：怎么把unicode编码的字写入文件呢，如果直接用open()的话，会提示UnicodeEncodeError: ...

Python实现点阵字体读取与转换的方法

09-19

6. `render_font_rect`: 输出点阵信息，`rect_list`参数可以自定义，如果未提供，则使用类内部的`rect_list`。代码中还定义了一个`KEYS`列表，用于解码字节中的每一位。每个值代表一个二进制位，从最高位到最低位...

如何使用python输入、输出文本？

Taoran_1的博客

01-31

1万+

如何使用python输入、输出文本？在编程中，一共有三种过程——输入、整理、输出。今天我们就来谈一谈输出和输入。 1、输出我们使用print模块来输出，这是python中最基础的输出。 python2和python3的print用法不一样，以下是python2的用法。 print 'Hello！' 以下是python3的用法。 print('Hello!') ...

Python常用中文分词库：jieba

z099164的博客

04-18

3455

中文分词，通俗来说，就是将一句(段)话按一定的规则(算法)拆分成词语、成语、单个文字。中文分词是很多应用技术的前置技术，如搜索引擎、机器翻译、词性标注、相似度分析等，都是先对文本信息分词处理，再用分词结果来搜索、翻译、对比等。在Python中，最好用的中文分词库是jieba。用“结巴”给一个中文分词库命名，非常生动形象，同时还带有一种程序员式的幽默感。最好的Python中文分词组件 “结巴”中文分词：做最好的Python中文分词组件这是jieba分词的slogan，打开jieba分词的GitHub、

python生成汉字图片字库

weixin_30904593的博客

06-19

745

　　最近做文档识别方面的项目，做汉字识别需要建立字库，在网上找了各种OCR，感觉都不好，这方面的技术应该比较成熟了，OCR的软件很多，但没有找到几篇有含金量量的论文，也没有看到哪位大牛公开字库，我用pygame渲染字体来生成字库，也用PIL对整齐的图片进行切割得到字库。 pygame渲染字体来生成字库　　用pygame渲染字体我参考的这篇文章，根据GB2323-8标准，汉语中常用字3500个...

python中文字体下载_用python输出汉字字库

weixin_39690391的博客

11-23

834

问题1：假设我们知道汉字编码范围是0x4E00到0x9FA5，怎么从十六进制的编码转成人类可读的字呢？问题2：怎么把unicode编码的字写入文件呢，如果直接用open()的话，会提示UnicodeEncodeError: ‘ascii‘ codec can‘t encode character u‘\u4e00‘ in position 0: ordinal not in range(128)问...

用python画小鸭,Python 处理输入法字库(五笔极点字库转小鸭字库)

weixin_30767257的博客

03-27

303

Python 处理输入法字库(五笔极点字库转小鸭字库)Python 处理输入法字库(五笔极点字库转小鸭字库)一直都是用的小鸭五笔,091新字库是极点格式的,刚开始懒得动,直接用极点五笔了,用了一段时间碰到很多问题.其中最坑的是. 在tkinter Gui 里极点输入不能退格,一退格就乱码() ,我以为是我开发的程序有问题,调试了很久都找不到原因. 突然想到会不会是输入法问题,换个输入法就OK 了...

Python生成汉字字库文字，以及转换为文字图片

JohnieLi的博客

07-26

2万+

笔者小白在收集印刷体汉字的深度学习训练集的时候，一开始就遇到的了一个十分棘手的问题，就是如何获取神经网络的训练集数据。通过上网搜素，笔者没有找到可用的现成的可下载的汉字的训练集，于是笔者采用了代码自建汉字的训练集数据。

python中文字体下载_对Python生成汉字字库文字,以及转换为文字图片的实例详解...

weixin_39542608的博客

11-23

647

python/基础输出输入用法

weixin_30662109的博客

03-28

275

输出及输入的简单用法 print print，中文意思是打印，在python里它不是往纸上打印，而是打印在命令行，或者叫终端、控制台里面。print是python里很基本很常见的一个操作，它的操作对象是一个字符串（什么是字符串，此处按住不表，且待日后慢慢道来）。基本格式是：print你要打印的东西或者print(你要打印的东西)这里一定要英文字符的括号，所有程序中出现的符号...

python工具方法 13 win系统字库保存为图片文件

a486259的博客

10-14

475

将系统中的字体保存为图片，为orc提供训练数据一、字体库存储路径 win10系统字库文件所在的目录为c:\Windows\Fonts\ 二、字体库提取保存代码代码中选择的字体库是Microsoft YaHei的，字库保存的代码如下 #encoding: utf-8 import os import pygame chinese_dir = 'chinese/'#要保存的目录 if not os.path.exists(chinese_dir): os.mkdir(chinese.

最新版的Python写春联，支持行书隶书楷书，不再有缺失汉字