Ubuntu中opencv图片上输出文字

最新推荐文章于 2022-05-21 21:32:39 发布

愚ふ者

最新推荐文章于 2022-05-21 21:32:39 发布

阅读量341

点赞数

文章标签： ubuntu opencv linux

本文链接：https://blog.csdn.net/big_west/article/details/121308387

版权

本文介绍了在Ubuntu操作系统中，如何使用C++和OpenCV库读取汉字点阵字库，将名字和学号叠加在图片上。通过理解汉字编码、点阵字库原理，结合OpenCV库实现汉字在图片上的输出。

摘要由CSDN通过智能技术生成

文章目录

一、实验要求
二、汉字点阵字库原理
三丶在Ubuntu中使用opencv在图上输出文字

一、实验要求

学习理解汉字的机内码、区位码编码规则和字形数据存储格式。在Ubuntu下用C/C++(或python) 调用opencv库编程显示一张图片，并打开一个名为"logo.txt"的文本文件（其中只有一行文本文件，包括你自己的名字和学号），按照名字和学号去读取汉字24*24点阵字形字库（压缩包中的文件HZKf2424.hz）中对应字符的字形数据，将名字和学号叠加显示在此图片右下位置。

二、汉字点阵字库原理

1.汉字编码

区位码
所谓汉字编码，就是采用一种科学可行的办法，为每个汉字编一个唯一的代码，以便计算机辨认、接收和处理。在此介绍的是《国家标准信息交换汉字编码》。这种编码经过加工整理一律以汉语拼音的字母为序，音节相同的字以使用频率为序，其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。
机内码
汉字机内码，又称“汉字ASCII码”，简称“内码”，指计算机内部存储，处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码，与所采用的键盘输入法无关。机内码是汉字最基本的编码，不管是什么汉字系统和汉字输入方法，输入的汉字外码到机器内部都要转换成机内码，才能被存储和进行各种处理。
因为汉字处理系统要保证中西文的兼容，当系统中同时存在ASCII码和汉字国标码时，将会产生二义性。例如：有两个字节的内容为30H和21H，它既可表示汉字“啊”的国标码，又可表示西文“0”和“!”的ASCII码。为此，汉字机内码应对国标码加以适当处理和变换。
国标码的机内码为二字节长的代码，它是在相应国标码的每个字节最高位上加“1”，即
汉字机内码=汉字国标码+8080H
例如，上述“啊”字的国标码是3021H，其汉字机内码则是B0A1H。
汉字机内码的基础是汉字国标码。
机内码：为了避免ASCII码和国标码同时使用时产生二义性问题，大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性，又使汉字机内码与国标码具有极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为：区位码（十进制）的两个字节分别转换为十六进制后加2020H得到对应的国标码；机内码是汉字交换码（国标码）两个字节的最高位分别加1，即汉字交换码（国标码）的两个字节分别加80H得到对应的机内码；区位码（十进制）的两个字节分别转换为十六进制后加A0H得到对应的机内码。

2. 点阵字库结构

点阵字库存储
在汉字的点阵字库中，每个字节的每个位都代表一个汉字的一个点，每个汉字都是由一个矩形的点阵组成，0 代表没有，1 代表有点，将 0 和 1 分别用不同颜色画出，就形成了一个汉字，常用的点阵矩阵有 1212, 1414, 16*16 三种字库。

字库根据字节所表示点的不同有分为横向矩阵和纵向矩阵，目前多数的字库都是横向矩阵的存储方式(用得最多的应该是早期 UCDOS 字库)，纵向矩阵一般是因为有某些液晶是采用纵向扫描显示法，为了提高显示速度，于是便把字库矩阵做成纵向，省得在显示时还要做矩阵转换。我们接下去所描述的都是指横向矩阵字库。
16*16 点阵字库
对于 1616 的矩阵来说，它所需要的位数共是 1616＝256 个位，每个字节为 8 位，因此，每个汉字都需要用 256/8=32 个字节来表示。

即每两个字节代表一行的 16 个点，共需要 16 行，显示汉字时，只需一次性读取 32 个字节，并将每两个字节为一行打印出来，即可形成
1414 与 1212 点阵字库
对于 1414 和 1212 的字库，理论上计算，它们所需要的点阵分别为(1414/8)=25, (1212/8)=18 个字节，但是，如果按这种方式来存储，那么取点阵和显示时，由于它们每一行都不是 8 的整位数，因此，就会涉到点阵的计算处理问题，会增加程序的复杂度，降低程序的效率。

为了解决这个问题，有些点阵字库会将 1414 和 1212 的字库按 1614和 1612 来存储，即，每行还是按两个字节来存储，但是 1414 的字库，每两个字节的最后两位是没有使用，1212 的字节，每两字节的最后 4 位是没有使用，这个根据不同的字库会有不同的处理方式，所以在使用字库时要注意这个问题，特别是 14*14 的字库。

3.汉字点阵的获取

利用区位码获取汉字
汉字点阵字库是根据区位码的顺序进行存储的，因此，我们可以根据区位来获取一个字库的点阵，它的计算公式如下：
点阵起始位置 = ( ( 区码 − 1 ) ∗ 94 + ( 位码 – 1 ) ) ∗ 汉字点阵字节数点阵起始位置 \ = \ ((区码- 1) \ *94 \ + \ (位码 – 1)) \ * \ 汉字点阵字节数
点阵起始位置 = ((区码−1) ∗94 + (位码–1)) ∗ 汉字点阵字节数

获取点阵起始位置后，我们就可以从这个位置开始，读取出一个汉字的点阵。

**利前面我们己经讲过，汉字的区位码和机内码的关系如下：

高位字节 = 区码 + 2 0 H + 8 0 H ( 或区码 + A 0 H ) 低位字节 = 位码 + 2 0 H + 8 0 H ( 或位码 + A 0 H ) 高位字节 = 区码 + 2 \ 0H + 8 \ 0H(或区码 + A \ 0H) \ 低位字节 = 位码 + 2 \ 0H + 8 \ 0H(或位码 + A \ 0H)
高位字节=区码+2 0H+8 0H(或区码+A 0H)
低位字节=位码+2 0H+8 0H(或位码+A 0H)

反过来说，我们也可以根据机内码来获得区位码：

区码 = 机内码高位字节 − A 0 H 位码 = 机内码低位字节 − A 0 H 区码 = 机内码高位字节 - A \ 0H \ 位码 = 机内码低位字节 - A \ 0H
区码=机内码高位字节−A 0H
位码=机内码低位字节−A 0H

将这个公式与获取汉字点阵的公式进行合并计就可以得到汉字的点阵位置。

三丶在Ubuntu中使用opencv在图上输出文字

创建一个C++文件，输入以下代码

#include<iostream>

#include<opencv/cv.h>

#include"opencv2/opencv.hpp"

#include<opencv/cxcore.h>

#include<opencv/highgui.h>

#include<math.h>

using namespace cv;

using namespace std;

void paint_chinese(Mat& image,int x_offset,int y_offset,unsigned long offset);

void paint_ascii(Mat& image,int x_offset,int y_offset,unsigned long offset);

void put_text_to_image(int x_offset,int y_offset,String image_path,char* logo_path);

int main(){
   

    String image_path="null25fd66517ef45616.jpg";

    char* logo_path=(char