Symbian 汉字拼音转换

最新推荐文章于 2024-11-15 14:29:50 发布

qxj19870501

最新推荐文章于 2024-11-15 14:29:50 发布

阅读量1k

点赞数

文章标签： symbian list user 优化网络手机

本文链接：https://blog.csdn.net/qxj19870501/article/details/5476651

版权

网络上汉字转拼音的方法一般分 2 种

1 查表法需要定义对应表

2 分支法 if else 判断

由于汉字在 GBK 编码的时候 4000 左右的常用字是按拼音顺序安排的，之后新增的汉字无法再按拼音顺序插入，所以之后的汉字是按笔画排序的。

Gbk 的编码可是查看 http://www.knowsky.com/resource/gb2312tbm.htm#top

在网上找到字库比较全的 if else 分支判断代码这个非常感谢牛文平

我在使用他的代码时也纠正了有些汉字的编码错误，得到我想要的汉字编码表。由于程序在手机上运行， if else 判断效率太低，而编码表的建立需要 50K 的编码表，内存虽说有点大，不过可以改进，就选用查表法实现。

首先在 Carbide 中模拟器得到的汉字是 Unicode 编码，需要转换成 GBK 才能使用表来进行查找。下面的函数就是实现 Unicode 转成 GBK 的编码，调用 Symbian SDK 的 ConvertFromUnicode （）函数实现。（需要导入 <charconv.h> 和 charconv.lib 库）

void ConvUni2Gbk ( TDesC & aUnicode, TDes8 & aGbk)

{

TInt state= CCnvCharacterSetConverter :: KStateDefault ;

CCnvCharacterSetConverter * converter = CCnvCharacterSetConverter :: NewLC ();

if (converter-> PrepareToConvertToOrFromL (KCharacterSetIdentifierGbk, CEikonEnv :: Static ()-> FsSession ())!= CCnvCharacterSetConverter :: EAvailable ) // 在转化前判断是否可以转化

User :: Leave (KErrNotSupported);

if ( CCnvCharacterSetConverter :: EErrorIllFormedInput ==converter-> ConvertFromUnicode (aGbk,aUnicode,state))// 这里开始转化

User :: Leave (KErrArgument);

CleanupStack :: PopAndDestroy ();

}

TBuf8 <2> a[] = { _L8 ( "0" ), _L8 ( "1" ), _L8 ( "1" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ),

_L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "2" ), _L8 ( "3" ), _L8 ( "3" ), _L8 ( "3" ), _L8 ( "3" ), _L8 ( "3" ),

_L8 ( "3" ), _L8 ( "3" ), _L8 ( "3" ), _L8 ( "3" ), _L8 ( "4" ), _L8 ( "4" ), _L8 ( "4" ), _L8 ( "5" ), _L8 ( "5" ), _L8 ( "5" ), _L8 ( "5" ),

_L8 ( "5" ), _L8 ( "5" ), _L8 ( "5" ), _L8 ( "5" ), _L8 ( "5" )};

定义拼音 a 的表，（之后可以定义其他的表，这里使用 TBuf8<2> 与 TInt 数据大小相同）

TBuf8 <5> all[] = { _L8 ( "&" ), _L8 ( "a" ), _L8 ( "ai" ), _L8 ( "an" ), _L8 ( "ang" ), _L8 ( "ao" ),

_L8 ( "e" ), _L8 ( "ei" ), _L8 ( "en" ), _L8 ( "er" ), _L8 ( "eng" ),

_L8 ( "ha" ), _L8 ( "hai" ), _L8 ( "han" ), _L8 ( "hang" ), _L8 ( "hao" ),

_L8 ( "he" ), _L8 ( "hen" ), _L8 ( "heng" ), _L8 ( "hi" ),

_L8 ( "hong" ), _L8 ( "hou" ),

_L8 ( "hu" ), _L8 ( "hua" ), _L8 ( "huai" ), _L8 ( "huan" ), _L8 ( "huang" ), _L8 ( "hui" ), _L8 ( "hun" ), _L8 ( "huo" ),

_L8 ( "i" ), _L8 ( "ia" ), _L8 ( "ian" ), _L8 ( "iang" ), _L8 ( "iao" ), _L8 ( "ie" ), _L8 ( "in" ), _L8 ( "ing" ), _L8 ( "iong" ), _L8 ( "iu" ),

_L8 ( "o" ), _L8 ( "ong" ), _L8 ( "ou" ),

_L8 ( "u" ), _L8 ( "ua" ), _L8 ( "uai" ), _L8 ( "uan" ), _L8 ( "uang" ), _L8 ( "ue" ), _L8 ( "ui" ), _L8 ( "un" ), _L8 ( "uo" )};