汉字主笔画技术初探

一、打开汉字之门

1、伟大的文字

汉字,是记录汉语的书写符号系统。

《说文解字》序说:"黄帝之史仓颉,见鸟兽蹄爪之迹,知今之可相别异也,构造书契。"《平阳府志》记载:"上古仓颉为黄帝古史,生而四目有德,见灵龟负图,书丹甲青文,遂穷天地之变,仰视奎星圆曲之变,俯察龟文、鸟羽、山川,指掌而创文字,文字既成,天为雨粟,鬼为夜哭,龙为潜藏。"

甲骨文是中国已发现的古代文字中时代最早、体系较为完整的文字。又称为“殷墟文字”、“殷契”,是中国商代后期王室用于占卜记事而刻在龟甲和兽骨上的文字。19世纪末在殷代都城遗址(今河南安阳小屯)被发现。

汉字是现在仍在使用的历史最悠久的文字。与它同时期的古巴比仑的楔形文字、古埃及的象形文字、古印度的印章文字,都先后湮灭在历史的长河中。只有汉字,历尽沧桑却久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。

2、汉字的困惑

与西方字母文字不同,汉字是属于表意文字的词素音节文字。在形体上表现为由众多笔画构成的方块形符号,一般也叫“方块字”。

汉字这种特点带来的一个突出问题就是字形难记、难写,近代以后,这个问题更加明显。为此,建国后,大陆推行了汉字简化,而原属汉字文化圈的韩、越等国则推出了自己的拼音文字。

简体字有效降低了汉字学习难度,但字形难记问题仍然存在,这在现代幼儿汉字教学和对外汉语教学中尤其突出。现行的解决办法是初期记音不记形,只读不写,虽然降低了学习难度,但也造成了学习内容的缺失,未能从根本上解决问题。

现代信息技术迅速发展带来的另一大难题是汉字输入。突出表现是现在人们一般只能借助拼音间接输入汉字,虽然应用很广,但长期使用,很容易导致提笔忘字,造成整个社会的汉字水平持续下降。

因此,平静的表面下,汉字其实是很尴尬和无奈的。

随着中国国力的强势崛起,中华文化正在大踏步走向世界,作为文明的载体,汉字肩负着文化传播的重任。汉字眼下的这种状况,也阻碍着它所担负使命的顺利实现。

3、解决的途径

理论上,解决这个问题,有两个办法:

一是汉字的废止,重新转换成另一种文字,就如原属汉字文化圈的韩、越等国所做的那样。

但这一是意味着汉字传承的断绝,更重要的是,这在现实上是完全行不通的。且不说有没有强大的国家意志、民意基础,光从经济上说,代价要多大?全社会重新学习的代价,又是多大?而且,谁又能保证,替代的会是一个完美无缺的文字体系,不会出新的问题,就像现在韩、越等国已经出现的那样?

再一个方法,就是尊重现实,在不改动现有汉字形体的基础上,通过汉字理论的进步,解决汉字现有的应用问题。

从历史上看,这种方法是客观存在着的。

a、六书概念的出现,形成了一个自觉的汉字创制体系。

b、笔画概念的出现,使汉字由图画变化为今天的形态,成了古今文字的分水岭。

c、部首概念的出现,便利了人们的检字、识字。

d、以王码五笔为代表的字根概念的提出,解决了当时最急迫的汉字快速输入问题。

诸如此类,是有很多的。

所以问题真正的关键,就是我们现在能不能有新的汉字技术,解决眼下的汉字应用难题。这是问题的真谛,其它的,都是假象,假命题。

4、汉字的钥匙

汉字为什么难记、难写?曰:字形复杂。

为什么复杂?曰:

  1. 偏旁数目太多,《说文解字》作为部首的偏旁就有540个,《现代汉语词典》作为部首的偏旁有201个。

     2、汉字笔画太多,独体字笔画普遍在三四个以上,合体字笔画普遍在七八画以上,多的可能达四五十个,如“龘”字。

那么,怎么办呢?

最好就是,“化繁为简”“化多为少”:数百的偏旁给压缩,最好变成几十个;每个汉字七八个甚至四五十个的笔画也给压缩,最好变成寥寥几个。

但同时,汉字的形态是不能变化的,所含笔画的数目是不能增减的,所以这种“压缩”又只能是内在的,是偏旁自身意义上的归类,是笔画自身意义上的简化。

这种“内在”必不是人为的创造,而是汉字本身就有的。也绝不是简单的某种标准的归类,而应是直观的、理所当然的契合。

二、主笔画

研究发现,一个偏旁不论笔画有多少,其中最核心、最有决定性、最有代表性、最有区别性的,一定是它的折笔画。如“飞、之、而”等。

也就是说,在几个偏旁里,可能都有着横竖撇点几个笔画,但它们的折笔画一般是不同的。折笔画起着最重要的区分偏旁的作用,是这个偏旁的核心,是最主要的笔画,我把它称为主笔画。其它的笔画相对只起了辅助作用,称为副笔画。

这就形成了一个猜想:是不是所有的偏旁,都是有主笔画和副笔画之分呢?

统计了gbk大字库21003个字的偏旁,约66974个,其中,含折笔画的偏旁,有42199个,占了三分之二。

就是说,与折笔画紧密相关的汉字偏旁的主副笔画属性特征,在绝大多数汉字偏旁里,都是成立的。

那么,就可以下这个结论了:

a、构成汉字偏旁的笔画,是有主副之分的:其中,折笔画起主导作用,是主笔画,其它的横竖撇点众多笔画,只起辅助作用,是副笔画。

b、一个偏旁有且只有一个主笔画。

理论上说,主笔画既然是“最核心、最有决定性、最有代表性、最有区别性”的笔画,这样的笔画也应该只有一个。

从汉字自身来看,gbk大字库含折笔画的42199个偏旁中,只含一个折笔画的偏旁,为36000来个,占绝大多数。

这说明,一个偏旁有且只有一个主笔画,也是客观存在。这个结论,是符合汉字自身规律的。    

c、主笔画是汉字的本质结构形式

一个汉字偏旁,实质就是一个主笔画;同一主笔画的不同偏旁,本质就是同一主笔画的不同表现形式,类于化学概念中的同素异形体;一个汉字,实质就是几个主笔画的组合。

如“之”,其本质就是一个主笔画“フ”;“又、久、之、夕、歹”等多个偏旁,就是主笔画“フ”的不同外在表现形式;而如汉字“过”,实质就是两个主笔画“亅ㄋ”的组合。

这个观点,多少有点离经叛道,但对于汉字研究来说,最难的就是捅破这层窗户纸。剩下的工作,就简单的多了。

三、两种特殊情况

(1)偏旁中有多个折笔画

观察发现一个有趣的现象:这些偏旁所含的多个折笔画,其应用频次相对较少,重复率较低,较具区别作用的,往往是它的最后一个折笔画。

如“也”,有两个折笔画“つ乚”,第一个折笔画“つ”在gbk大词库21003个汉字中,应用频次是4893;而第二个折笔画“乚”的应用频次是2343。

与此同时,这些偏旁的最后一个折笔画,特征也相对突出,较有代表性和区别性。

因此,一个偏旁中如果有多个折笔画,取它的最后一个折笔画为主笔画。    

(2)偏旁中没有折笔画

从统计中看,约有三分之一的汉字偏旁,是没有折笔画的。

这样就只有一个选择:在其现有的单笔画中选取主笔画。

从日常经验看,人们最熟悉也最直观的,是偏旁的前两个笔画。

统计来看,gbk大字库21003个字的偏旁中,以首笔画为主笔画,四种笔画的应用频次分别是:横8198、竖721、撇6320、点5201;以次笔画为主笔画,四种笔画的应用频次分别是:横5986、竖6898、撇3371、点4649。

很显然,以次笔画为主笔画的四种笔画频次最为均衡,也最具代表性。

因此,偏旁中如果没有折笔画,则取其次笔画为主笔画。 

如“十”的次笔画“丨”,“人”的次笔画“丶”等。 

四、数量及规则

  1. 折笔画

现代汉语中各种折笔画共有24个,考虑到有些笔画之间只是形体上的变异,而且应用较少,可视为同一个笔画。如“几、讠、乙、”中的折笔画。

现归类为15个,分别是 “乛 つ ┐フ ゝ   亅 ㄣ ㄋ 乙 ╰    し乚 ∟ ㄥ ㄑ”。

     2、单笔画

按现代汉语习惯,单笔画保持横竖撇点4种笔画不变。   

这样,汉字主笔画共有折笔画15个,单笔画4个,共19个笔画。其选取规则简单归结为:末折优先,无折取次。  

这是最简单的主笔画方案。

五、加强版本

上述方案中,单笔画数量仅有4个,却对应了约有三分之一的汉字偏旁,这个比例和折笔画是不相称的。

同时,个别主笔画在应用频次上是有些失衡的。

如折笔画“┐”,作为主笔画的应用频次明显要多:在gbk大词库21003个汉字中,应用频次达到了创纪录的14841个,大大超出其它笔画应用频次,这在应用中是很不利的。

为了保持数量上的平衡,加强实际应用效果,综合考虑多种可能,在这些笔画中选取较为常用的七个偏旁“口日艹木大土氵”,独立出来,视为部首形态的折笔画,优先选取。

如“中”,主笔画为“口”;“禾”,主笔画为“木”。

由此,汉字主笔画(部首)增加为26个,选取规则相应调整为:末折(部)优先,无折取次。

六、主笔画技术的应用和意义

1、有助于认清汉字本质

过去认为汉字结构繁杂,让人头疼,那是犯了眉毛胡子一把抓的毛病。

主笔画技术出现后,汉字就简单多了:一个偏旁就是一个主笔画,一个汉字大多就是两三个主笔画的组合。汉字结构变得极其清晰明了,更容易学习和掌握。

2、汉字学习方法将发生极大变化

主笔画是汉字本质结构形式,某种意义上,也是最简化的汉字。

由此,我们可以先掌握汉字主笔画,再熟悉全字形,形成新的“识繁用简”模式。

这种习字方法,可最有效的快速记忆和应用汉字,非常适于幼儿识字、对外汉语教学等。

3、彻底解决了汉字输入问题

主笔画技术可直接用于简易手写输入和大键盘输入,为二代手写和二代形码输入。

4、可做为一种新的汉字排序和查阅手段等。

主笔画技术丰富和发展了现有汉字技术理论,使汉字的现有学习和应用更容易、更多样,有极大的现实意义。

主笔画概念也给汉字的未来发展留下了广阔的想象空间,颇具前瞻性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值