去找了一本《郑码输入法手册》,然后开始了郑码的学习。这一部分主要是对郑码的基本编码规则做一个了解,然后学习郑码中汉字的分解方式。
一、 认识郑码输入法
1. 简介
郑码输入法是一种较为流行的汉字输入法,与传统的形码输入法的相似之处在于:从汉字的结构入手,将汉字分为若干部分,按某种规律安排键位,也要建立某种汉字的拆分规则等等。熟练使用郑码输入法,可以让我们的打字速度有很大的提升,因为输入单个字和词语的编码不会超过四个字母。
2. 郑码输入法基本原理
汉字大多数是合体字,由两个或两个以上单元组合而成,其中最基础的构字单元是字根,最小的构字单元是笔画。将汉字拆分为字根与字根的组合,或者字根与笔画的组合,按照一些规则利用字母对字根和笔画安排了英文字母做代码,用这些代码就可以编出汉字和词语的编码。最后用郑码系统可以将这些编码转化为汉字显示出来。
二、 郑码编码规则
1. 字根
对于汉字的组成,我们如果仅仅以部首来构成汉字,编码会很不方便,比如“木”在“相”和“想”中就处于不同位置,所以郑码引入的概念是利用“字根”来进行组字。为了便于人们的习惯,郑码选择了160个常见的部首作为编码的基本字根,这些占了基根的90%,另外10%是约定俗成的,如“二、其、羊”等。
2. 字根代码排列
郑码的基本字根,采用的是前两笔的笔形进行分类排列,所以我们只要沿着“笔形”这一脉络,就可以对基根相应的代码进行掌握。郑码是按照“横、竖、撇、点、折”的排列顺序排列的,我们只要去掌握他们分别的映射关系,就可以了解他的代码。
三、 汉字的构成
1. 汉字组字单位
原始的汉字是一种图画文字,最开始的字是独体字,也就是一些不可拆分的字。后来随着人们的需要,独体字不够用了,就将它们组合形成了合体字,在独体字形成合体字后,这些独体字就转变成为了字根。所以,组成汉字的基本单元就是字根,而笔画是最小单元。
2. 汉字的基本笔形
笔画的形状叫做笔形,笔形有二十多种,目前把基本笔形定为“横、竖、撇、点、折”5种。其他笔形按照笔势可以归并到相应的基本笔形中,看做这五种基本笔形的变体笔形。
笔形 | 走向 | 变体笔形 |
---|---|---|
横 | 从左到右 | 横提 |
竖 | 从上到下 | 竖勾 |
撇 | 从右上到左下 | 横撇 |
点 | 从左上到右下 | 捺 |
折 | 弯(也就是 横折) 拐 (也就是 竖折) | 单弯 复弯 单拐 复拐 |
其中,单弯与复弯、单折与复折是折一次与多次的区别。
3. 汉字的字根
我们这里是需要进行编码,所以介绍一下汉字字根按照编码需要进行的分类。字根按照编码需要可以分为基本字根和一般字根两种:我们将组字能力强、使用次数多的字根优选出来,构成了郑码的170个基本字根,简称“基根”;基根以外的字根统一称为一般字根,简称“一般根”,一般根没有特定的编码,要对它做变通的分解处理后才能进行编码(后面再学习)。
字根的笔顺是郑码进行代码编码时需要用到的字母对应规则,实际上字根的笔顺与汉字的笔顺是一致的,所以我们学习郑码也需要掌握汉字的书写笔顺,这里就不进行介绍了。
四、 汉字的字型与分解
1. 汉字的字型
汉字的结构类型称为字型,汉字的字型有单体型与合体型两大类。单体型字只有一个组字单元,可以是基根或者一般根。合体型字由两个或者两个以上的字根组成,主要分为左右型字、上下型字、包围或包孕型字。
2. 汉字的分解
汉字要按照郑码选用的基根和通常的笔画来进行分解,具体的规则是先分解为基根,如果一般根无法分解为基根,就将其分解为基根与笔画的组合,还有少部分只能分解为笔画的组合。分解后的基根和笔画基本按照书写顺序排列先后。
3. 字根的根序
对于郑码的基根顺序,一般是按照我们书写汉字的顺序,具体如下:
对于左右结构的汉字,顺序是先左后右;
对于上下结构的汉字,顺序是先上后下;
对于包围结构的汉字,视为“外内字”,顺序是先外后里,比如“困”;
对于包孕结构的汉字,我们可以分为上、下包孕型,如“间、凶”;左上、右上包孕型,如“房、式”;左三包孕型,如“区”;左下包孕字,如“还”。包孕字可以当做“左右字”或者“上下字”处理。
包孕字的顺序一般也与我们的书写顺序一致,但是对于“建”和“还”这一类字,我们是先“廴”和“辶”,又比如“式”,我们是先“戈”后“工”。这是与平时书写习惯不一致的地方,需要注意。