字符编码及字体显示
在lcd上显示文件
1.去文件获得“编码”(GBK,ASCII,UTF-8,UTF-16BE,UTF-16LE)
2.根据“编码”得到“字体数据(点阵)”(ASCII,GBK,freetype)
3.把点阵在lcd上显示
文件的编码方式目前可以解析的包括4种:ANSI(ASCII,GBK),UTF-8,UTF-16BE,UTF-16LE。
encoding模块的主要功能 :
解析文件,获取 “编码值”
每种方式主要实现了 GetCodeFrmBuf(buf起始地址,buf结束地址,编码值)函数,通过解析文件获得字符的编码值。
encoding模块包含encoding_manager.c,ascii.c,utf-8.c,utf-16be.c,utf-16le.c,其中page_manager.c通过链表管理这4中编码方式。主要包括ascii编码和unicode编码方式。
每个编码方式向上注册EncodingOpr结构体,由encoding_manager.c通过链表管理这些结构体。
typedef struct EncodingOpr {
char *name; /* 编码模块的名字 */
int iHeadLen; /* 文件头的长度: 一般在文件的开始用几个字节来表示它的编码方式 */
PT_FontOpr ptFontOprSupportedHead; /* 把能支持这种编码的"字体模块", 放在这个链表里 */
int (*isSupport)(unsigned char *pucBufHead); /* 用这个函数来判断是否支持某个文件 */
int (*GetCodeFrmBuf)(unsigned char *pucBufStart, unsigned char *pucBufEnd, unsigned int *pdwCode); /* 取出一个字符的编码值 */
struct EncodingOpr *ptNext; /* 链表 */
}T_EncodingOpr, *PT_EncodingOpr;
encoding_manager.c
int RegisterEncodingOpr(PT_EncodingOpr ptEncodingOpr) //注册"编码模块"
PT_EncodingOpr SelectEncodingOprForFile(unsigned char *pucFileBufHead) //给文件选择一个编码模块
int AddFontOprForEncoding(PT_EncodingOpr ptEncodingOpr, PT_FontOpr ptFontOpr)
int DelFontOprFrmEncoding(PT_EncodingOpr ptEncodingOpr, PT_FontOpr ptFontOpr)
int EncodingInit(void) //调用各种编码方式的初始化函数
给文件选择一个编码模块
PT_EncodingOpr SelectEncodingOprForFile(unsigned char *pucFileBufHead){
PT_EncodingOpr ptTmp = g_ptEncodingOprHead;
while (ptTmp){
if (ptTmp->isSupport(pucFileBufHead))
return ptTmp;
else
ptTmp = ptTmp->ptNext;
}
return NULL;
}
要显示一个字符, 涉及三个概念:
1 字符的编码值, 即这个文件用什么数值来表示,
比如’A’用0x41来表示, '中’的编码方式有多种, GBK编码方式里它的数值为0xD0D6, 而在UNICODE编码里它的数值为0x4E2D。
2. 编码值的表示方式, 比如UTF8/UTF16LE/UTF16BE是UNICODE编码的三种表示方式
例如:'A’的ASCII表示为0x41;UTF16-LE表示为0x41,0x00;UTF16-BE表示为0x00,0x41;UTF8表示为0x41。
'中’的GBK表示为0xD6,0xD0;UTF16-LE表示为0x2D,0x4E;UTF16-BE表示为0x4E,0x2D;UTF8表示为0xE4,0xB8,0xAD。
注意:UTF8/UTF16LE/UTF16BE只是UNICODE编码的不同表示方式,对于同一个字符,它们表达的编码值是一样的,只是表示方法不同。
4. 字符的位图,即字符应该怎么描画
举例: 使用freetype矢量字库来显示UTF8编码格式的文件内容时,我们要先取出UTF8的值用来解析出UNICODE值,然后根据UNICODE值去字库文件中取出位图,最后在LCD上显示出来。
一个文本文件的编码方式是确定的,比如它要么是ANSI(字母用ASCII,汉字用GBK),要么是UTF8等等; 文件里字符的位图来源可以有多种,比如ASCII字符可以从确定的数组中获得它的位图, GBK字符可以从"HZK16"这个文件中获得它的位图,也可以从某个freetype矢量字库中获得它的位图。
AddFontOprForEncoding函数就是给某个编码方式(ptEncodingOpr)提供字符的处理方法(ptFontOpr),ptFontOpr将被放入"ptEncodingOpr->ptFontOprSupportedHead"链表中
输入参数: ptEncodingOpr - 编码方式
ptFontOpr - 字符处理结构体,内含"GetFontBitmap"函数(即根据编码值获得位图)
int AddFontOprForEncoding(PT_EncodingOpr ptEncodingOpr, PT_FontOpr ptFontOpr){
PT_FontOpr ptFontOprCpy;
if (!ptEncodingOpr || !ptFontOpr)
return -1;
else{
/* 分配一个新的T_FontOpr结构体 */
ptFontOprCpy = malloc(sizeof(T_FontOpr));
if (!ptFontOprCpy){
return -1;
else{
/* 复制结构体里的内容 */
memcpy(ptFontOprCpy, ptFontOpr, sizeof(T_FontOpr));
/* 把新结构体放入ptEncodingOpr->ptFontOprSupportedHead链表
* 为何不直接把原来的ptFontOpr放入链表?
* 因为原来的ptFontOpr->ptNext已经在RegisterFontOpr函数中被占用了
*/
ptFontOprCpy->ptNext = ptEncodingOpr->ptFontOprSupportedHead;
ptEncodingOpr->ptFontOprSupportedHead = ptFontOprCpy;
return 0;
}
}
}
AddFontOprForEncoding的反函数,从PT_EncodingOpr->ptFontOprSupportedHead链表中把某个PT_FontOpr去掉。
int DelFontOprFrmEncoding(PT_EncodingOpr ptEncodingOpr, PT_FontOpr ptFontOpr){
PT_FontOpr ptTmp;
PT_FontOpr ptPre;
if (!ptEncodingOpr || !ptFontOpr)
return -1;
else{
ptTmp = ptEncodingOpr->ptFontOprSupportedHead;
if (strcmp(ptTmp->name, ptFontOpr->name) == 0){
/* 删除头节点 */
ptEncodingOpr->ptFontOprSupportedHead = ptTmp->ptNext;
free(ptTmp);
return 0;
}
ptPre = ptEncodingOpr->ptFontOprSupportedHead;
ptTmp = ptPre->ptNext;
while (ptTmp){
if (strcmp(ptTmp->name, ptFontOpr->name) == 0){
/* 从链表里取出、释放 */
ptPre->ptNext = ptTmp->ptNext;
free(ptTmp);
return 0;
}
else{
ptPre = ptTmp;
ptTmp = ptTmp->ptNext;
}
}
return -1;
}
}