《和码字形技术》6.0版说明
和码汉字字形技术有三个主要内容:
1、字形输入(电脑字母键盘输入,手机数字键盘输入);
2、字形学习(儿童识字,对外汉语教学);
3、字形字母表(作为汉字字形线性化,汉字信息系统的建立与发展的基础)
和码字形技术第6版,是为完善和码汉字字形字母表而做的改进。
一、《和码》6.0版的主要修改
一、‘彐匚口凵冂’各占一个码
字母是平面的用线条组成的图形,‘彐匚口凵冂’是简单基本形义符号:
和码汉字字母表
‘彐匚口凵冂’也包含在其它文字的字母表中,如:
英文字母表:C(匚),O(口),U(凵),n(冂);有些英文字母是从这5个基本形义符号与‘一丨’笔画组合变化出来的:如:B,q,Q,p,v,w,m,G等。
![]() | ![]() |
希伯来(以色列)语字母表,多个字母是以‘彐匚口凵冂’为基础,或变化,或与‘一丨丿丶’结合而成的。
俄文字母表,多个字母是围绕‘彐匚口凵冂’变化而来的:
韩语字母表,有多个字母含有‘彐匚口凵冂’元素,再加上多个‘一’‘丨’的组合字母:
从以上可以看出,‘彐匚口凵冂’是世界多国文字字母的字形基础。
5.1版及之前的和码字根表,多从字根在汉字中的分布均匀性考虑,如把‘彐匚’在一起,‘凵冂’在一起。6.0版从汉字字母表的角度考虑,让‘彐匚口凵冂’各占一个位。
汉字字母表
各国文字的字母都有‘形’,有‘音’,和码字形字母,除包含‘形音’之外,还有‘义’,有‘序’:
1、字母表义
语言文字都是用来表意的。汉字的表义功能从字根(字母)就开始,如:
口:吃喝品味,唱叹哭骂;(eat, drink,taste,flavor, sing, sigh, cry, blame) ,与口有关的英文单字没有联系;
土:地坡墙城;(earth, slope, wall, city),与土有关的英文单字没有任何联系;
犭:猫狗猪狩;(cat, dog, pig, hunting),同类的动物单词,英文字没有任何联系;
氵:江河湖海;(creek, river, lake, sea),与水有关的英文单字,没有任何联系;
虽然不是所有的汉字都遵循这种易学易记的规律性,但几乎所有的英文单字都没有这样的规律性。
第一个字母相同的英文字:
a: anable, avery;after,alike,avoid,
d: day,drive,door,difficult,develop;
h: half,hand,happen,hall,Harry;
因为英文字母没有基本的字义,第一个字母相同的英文字都没有任何联系。因此英文单字比汉语单字难学。
其它的字母文字与英语相同。
2、字母排序
对20多个平面符号排序,不是件容易的事,各国文字字母都没有自然序性,都要靠死记硬背,才能得到部份序性。
和码字形字母表中的25个字母,以‘一1丨2十3丿4丶5’分五个区,区内从上到下由简到繁排位,使得和码字母表有很好的易记易用的序性。
其它文字的字母只有‘形音’两个特征,而和码汉字字形字母却有‘形音义序’四个特征。
二、字根分区排位,不仅要看字形,也要看字义
我们在说“汉字是象形文字”的时候,意思是字形与字义在一定程度上是一致的: 如:“日木人亻氵门口土女”,等等。
和码字根的排位以字形为基础,如以字根的第一笔画分区,同区的字根依复杂程度排位。
这样的分区,分出了汉字的一些形义特点:如:
‘丨’区:以框形为特征的字根:如:‘凵冂口日’等等。
‘十’区:集中了‘土艹木米’等自然概念的字根;
‘丿’区:‘丿’有似于动物的毛皮,‘丿’区就集中了人与动物的大部份字根:如:‘亻儿人女豸牛鼠’等等;
‘丶’区:‘丶’有似于水点与火点,‘、’区就集中了水与火有关的字根:如:‘冫氵之火灬心’等等;
但汉字字形在复杂的形成过程中,有些字根其字形与字义,却没有很好的一致性。 如:“石钅矢虫示阝”等等;
如仅以字形为标准,就会带来一些混乱,如:在5.1版及以前:
1、‘钅’与动物字根‘牛臼犭豸’在一起;
2、‘虫’与‘口’合并;
3、‘马石’排在横区;
4、‘(竹)’与‘人’在一起,等等。
这样的排布给汉字的字母表示带来混乱。
第六版,在字根排布时,也考虑字义, 如:
1、‘钅矢石’在一起;
2、‘虫马牛虍鹿’在一起;
3、‘(竹)’与‘艹’在一起;
4、‘阝’与‘土’在一起;
5、‘示’与‘礻’在一起,等等。
不按第一笔画排布的字根,共有9个码21个,特别列写在字根表的下面。
第六版的这一修改,给和码字根表的学习增加了难度,学习者要了解有些字根(如:石钅虫示阝马虍)的字义,才好理解与记忆其编码。
在汉字字形形成过程中,有些字根的‘形义’出现了不一致,用信息技术对汉字进行整理与输入时,对此做适当的纠正。
三、把横(一)与横折(乙乛フ)放在一起
‘一’作为一个字母,书写过于简单,‘一’也没有出现在其它文字的字母表中。6.0版把‘一’与‘乙乛フ’放在一起,就可以采用‘フ’做字母符号。
二、《和码》6.0版编码修改统计
(以GB2312的6763个字为统计范围)
5.0版 | 6.0版 | 改变 | |
M1M2个数 | 618 | 617 | -1 |
M1M2M3个数 | 4572 | 4567 | -5 |
6.0版对汉字的分辨率减少不多,对于常用3800(或5200)个字,分辨率减少会更小。
改变 | /6763 | |
第一码(M1) | 2145 | 31.7% |
第二码(M2) | 2259 | 33.4% |
第三码(M3) | 2449 | 36.2% |
M1M2 | 3699 | 54.7% |
M1M2M3 | 4785 | 70.8% |
6.0字根表,单字编码改变比例很大。又一次严重影响了用户形成的习惯,我深感抱歉。我也为此修改付出了很大代价,所有的软件资料都要做修改。希望能得到和码老用户的谅解与支持。
建议用户下载安装后,用和码练习软件从头开始做适应性练习。特别是多做一二码字的练习。
三、6.0版后是否还会有修改
和码的每次修改,都是因为编码目的发生了改变,目的变了,编码的标准,编码方法也就会做改变,如:
一、第1、2版:
编码目的:汉字字形输入,低重码,大小键盘通用,易学易记。
主要内容:25个数字码,字根依第一笔画的‘一丨丿丶’分四类,码值的概念,单字最多分三块最多取三码,剩余部份取最大值码。
二、第3、4版:
改进的目的:结合汉字字形学习。
主要内容:引入25个常用字根表及其形成图解,引入衍生字根的概念,编写汉字学习系列软件,如《汉字字形知识与技术》,《和码中文教程》第一、二册书与软件。
三、第5、6版:
改进的目的:建立和码汉字字形字母表,并与和码字根表结合在一起。
主要内容:
1、之前25个常用字根表里有两个‘一’(与其它笔画相离或相接的横,与其它笔画相交的横),两个‘口’(中间不含笔画的口,中间含笔画的口),第5版,把这两组字根合并,进而引入‘一丨十丿丶’的分区方法。
2、之前‘彐匚’在一起,‘凵冂’在一起。第6版,把‘彐匚口凵冂’各做一个码,并在字根排位时,不仅要看字形,也要看字义。
在6.0之后,和码的编码目的还会有变化吗?汉字字形编码是否还有下一个目标?
试想,几万或几亿年后,当地球人类的信息智能技术高度发达,文字有了充分自由的变化发展后,地球上的文字会是怎样的?
人类的文字不过几千年,外星球的文明也许规模更大,时间更长,几万年或几亿年,他们的信息智能技术已高度发达。那么他们的文字会是怎样的?
我的推理是:
1、文字应该是平面的,应该有文章,段落与句子,句子应该是由单字组成;
2.1)单字可能是方块,如汉字;
2.2)单字可能是由字母组成,如英文。
信息时代对文字的形式做了一次取舍,选择了字母文字。
原因很简单:
信息时代新概念层出不穷,信息代码需要随时地用字母组成新字表示新概念(函数,参数,变量,类,等等)。
大家都知道,我们也可以用汉字构词表示新概念。差别在于效率:
1)字母-->新字(新概念);
2)汉字-->新词(新概念)。
结果都是表示新概念,但英文是用字母,中文是用汉字,在这里汉字的功能相当于字母(汉字 = 字母),但英文字母只有26个,而常用汉字就有2千多个。英文26个字母与2千多个汉字(字母)比,学习量,效率与易用性,相差很大很大。
信息技术采用的文字,应为多个国家民族通用,只有字母少的文字才会有通用性,才会有效率。
因此信息时代对文字的形式做了一次取舍,选择了字母文字。
人类的信息时代已经开始,也许不会结束,如果汉字不建立自己的字形字母表,不对汉字进行字母线性化的改进,汉字终会被边缘化。
这就是说,人类文字的未来是字母文字,发达的外星球文字应是字母文字。
接着上面的推理,单字是由字母组成的,那么:
3、多少个字母最好?
4、字母表应该包括那些基本符号?
5、字母怎样排序?序性好的字母表,易学易记,没有序性的字母表,难学难记。
字母个数:英文26个;希伯来22个;俄文33个;韩文40个。范围就在20至40之间,再多了就增加了学习的难度,就不会是最好的选择。
字母表应该包括的基本符号:‘彐匚口凵冂’基本字形符号,与‘一(フ)丨(亅)十丿(く)丶(乀)’基本笔画符号,这10个符号的组合,可以构成各种不同形状的的字母。这也为各种文字的字母表所映证。
匚(C);口(〇);凵(u,v);冂(n),字母应许可书写方式的变化。
字母表排序:对20多个平面符号排序,不是件容易的事,各国文字字母都没有自然序性,都要靠死记硬背,才能得到部份序性。
和码字形字母表中的25个字母,以‘一1丨2十3丿4丶5’分五个区,区内从上到下由简到繁排位,使得和码字母表有很好的易记易用的序性。
在这几个方面,和码汉字字形字母表,都做了最好考虑。
用和码字母表改进汉字,可以给汉字很大的创造性,给汉字未来发展带来很大的空间。
和码汉字字母表
和码字母表留给未来修改的可能性有:
1)字母个数改变,如由25个改为30个;
2)字根书写的改变:‘一’-->‘フ’;‘丨’-->‘亅’;‘丿’-->‘く’;‘丶’-->‘乀’等;
除此之外,我现在还想不出别的变化可能性。