21世纪将是汉语拼音充分发挥威力的时代

21世纪将是汉语拼音充分发挥威力的时代》
作者:中国社会科学院语言研究所 刘涌泉

  目前大家都在谈论信息化社会,信息高速公路。从语言学角度来说,所谓信息化社会,最主要的特征就是利用电子计算机等先进工具对语言文字信息进行各种处理(包括语言文字信息的储存、分类、统计、检索、转换、传输、控制和模拟等),目的是建立现代化语言信息系统,使语言文字得到最佳利用,使凝聚在语言文字中的知识信息发挥最大效能。至于说信息高速公路,也不过是 " 快速传递语言文字信息之路 " 。当然还包括传输一些图像,而这些图像也是具有一定语言意义的信息。所以说,语言无所不在,无所不包。任何一种物质或任何一种精神存在,只有转换成语言信息,才能为人所认识和理解。


  语言文字的应用水平直接反映一个民族或一个社会的发展程度。先进的民族已处于 " 信息化时代 " 的前夕,后进的民族直到今天尚无文字,这就是语言文字应用水平的差别。
我国是一个古老的国家,在历史上我们的语言文字曾达到高度应用水平,创造了丰富的文化遗产。但是,近年来,由于各种原因,在采用新技术提高语言应用水平方面落后了一大截。比如,发达国家的学者名片上,地址、电话、传真、电子信箱,样样俱全。可我们的学者,除地址外,再有电话就不错了。


  建立信息高速公路,要求通讯、自动化、电子计算机、语言文字等部门通力合作。为此,我们必须抓紧搞好中文现代化。


  1、口语方面,目标很明确:就是全国推广普通话,尽可能快地使普通话真正成为全国大众传播语言、教学语言、工作语言和社会交际语言。搞方言的人应该研究方言和普通话的对比,以便帮助方言区的人尽快掌握普通话。国家语委及其下属单位必须大力贯彻《宪法》的规定: " 国家推广全国通用的普通话 " ,既要做好普通宣传工作,使全国人民认识学习普通话的重要性,又要做好具体指导工作,分步骤地提高人们的普通话水平。我在前些年写过一篇短文,题目 ?quot; 普通话与电脑 " ,那里边谈到,研制一个能掌握普通话的机器人(口语识别合成系统)已经是很费钱很费力的工作,方言区的人不要再想望出现适合自己口音的机器人了。普通话的机器人现在还未研制出来,但过不了多少年就会有的。希望方言区的人加紧学习普通话,否则就要 " 望机兴叹 " 了。


  2、书面语方面,主要谈以下三个问题
  2.1
  要搞好中文现代化,首先要把词典编好。为什么 " 首先要把词典编好 " 呢?因为词典是一面镜子,最能反映一个国家或民族的语言研究水平,最能说明语言文字的使用情况。我们的词典有不少语音错误,比如《现代汉语词典》中的异读词都未加规范,致使一系列以《现代汉语词典》为蓝本的词典也跟着错(如 1992 年出版的《西索汉英词典》, " 指 " 仍读三个音而未统读为 zhǐ ; " 古迹 " 仍读 gǔjī 而未读 gǔjì ; " 呆板 " 仍读 áibǎn 而未读 dāibǎn ; " 便秘 " 仍读 biànbì 而未读 biànmì 。为什么会是这种情景呢?原因是 1978 年出版的《现代汉语词典》经过 156 次印刷未修过版, 1985 年通过的 " 普通话异读词审音表 " 当然未被采纳。我们再问为什么这样出名的词典 16 年如一日没有再版呢?这就不能回避汉字出版物印刷难的问题了。尽管近年来我们在汉字信息处理方面已取得了很大成绩,但是比起拼音文字来还是小巫见大巫。用计算机编汉语词典还有一系列问题需要解决,然而, 20 卷的《牛津大词典》 1992 年已进入一张光盘。要想使我们的辞书跟上日新月异的时代( update ),避免《现代汉语词典》那种落后情况,必须使辞书工作计算机化。


  我们的词典至今连词类也没标。这怎么能便于人们学习呢?又怎么能满足机器的需要呢?词类是各类语言信息系统的基本依据,没有它,机器就无法进行语言分析。为什么标不出词类呢?我想一是过份强调汉语的独特性,强调多了,就要得出 " 词无定类 " 结论了。汉语的兼类现象的确严重,但英语的兼类问题也不轻啊。我的一个学生做过一次统计,在八万个单词的词典中有 6989 个兼类词,将近9%,兼六类的有两个词,即 like 和 but ,兼五类、四类、三类和两类的词数不等。同汉语情况差不多,兼类主要集中在名、动、形三类词当中。另一个原因就是总在汉字圈儿里打转转,不敢或不愿越雷池一步。我曾在一篇文章里说过,如果在汉语拼音读物的基础上研究汉语,很多问题会容易解决,汉语语法和词汇研究会有一种新景象出现。比如说,汉语构词形态不见得那么少,实际上语法学家也在不断修正自己的观点,前缀以前只承认两三个,后缀也不过十来个。而如今应该说各有几十个。再比如说 ," 了 " 、 " 着 " 、 " 过 " 、 " 起来 " 、 " 下去 " 等构形形态,如写成拼音,都是表示一定动态和体貌的词尾,表示 " 开始、实现、继续、完成、进行 " 等语法意义,它们都是动词的词尾,象英文的 -ed 、 -ing ,更象日文的词尾。从汉字观点来看, " 发展+起来 " 、 " 发展+下去 " ,四四方方都一般大,平起平坐,这类问题看不出来。以上只是几个例证,但都影响词类研究,也直接关系到词典内的词类标注。


  我们的词典还有一个问题,就是很多词没有收入。比方说,下面这十个常用的词 " 未婚、分之、途中、迷住、接待室、越来越、之所以、行不通、迷上,《现代汉语词典》及其《补编》都未收。似乎还不承认它们是词。《汉语拼音词汇》收了前八个,后两个尚未收。又比如,日益增多的字母词也没收: ? 超、 ? 型(血)、 CT 、 BP 机、 CD 、 TV 、 MTV 、 DNA 、 SOD 、 DOS 、 ISO 、 ATM 、 EMS 、卡拉 ?? 等等。好像还不愿意承认它们,可它们不仅在老百姓口中流传,而且经常出现在电视、报纸上。我认为,这种新形式的外来语的涌现,是一件好事情。以前借用外来语靠汉字,很不方便,致使很多音译外来语短命,现在用拼音字母转写或直接表达,非常省事。关于这个问题,有兴趣的同志可看 1994 年第 10 期《语文建设》,这里就不多谈了。
  顺便提一下,我们的检索法太多、太乱,有必要规范化。拿不太常用的笔画法来说,也有两种类型:有丶一丨丿的,也有一丨丿丶的。我认为,纯字母检索法是最好的检索法,应该大力提倡。


  我们希望,语言学界的朋友们不妨用汉语拼音的观点对汉语进行一番研究,并通过这种研究建立起符合汉语实际的语音、语法、词汇规范。这样做,对中文现代化,对编出高水平的词典,肯定会大有好处的。


  2 . 2要搞好中文现代化,必须大力推行双轨制输入法(以汉语拼音输入法为主,字形输入法为辅,后者是为方音重的人或为输入不认识的字准备的)。如果让计算机当打字机使用,那么什么输入法都没多大关系。但是,如果要建立语言处理系统(情报检索系统、机器翻译系统、自然语言理解系统等),那就大不相同了,因为任何语言处理系统都是以词为基本单位。比如说 ?quot; 这些外文资料需要翻译 " 这十个字,如果不分成五个词,怎么能译成 These foreign materials need translation 呢?现在,拼形方案的输入法为了切分词,采用 " 最大匹配法 " ,有所谓顺向匹配,逆向匹配,双向匹配, " 有穷多层列举自动分词法 " , " 逆向扫描、二字前进、最长组配、试探反馈的自动分词法 " 等等。但是,应该承认,无论哪一种都不能彻底解决问题。例如,机器碰上 " 美国会通过生产一种新式武器 " 这个短句,就很难办。后面几个词的切分不困难。前三个字如何切分就发生了问题,是 " 美 │ 国会 " ,还是 " 美国 │ 会 " ?两种切分语法上都成立,而且意思也讲得通。如果这是报纸上的一个标题,作第一种切分是正确的。但如果后面还有下文,而且是 " 来加强自己的实力 " 则第二种切分是正确的。如果下文是 " 并批准 " ,则仍应该是第一种切分。请看,这要绕多少弯子!机器要有多高的智能才能分辨清楚?如果提供这份材料的人(作者或译者)根据自己的意图写成 Meiguo hui / Meiguohui ,那机器该多省事。


  问题的严重性还在于,搞自动切分,要耗费电脑许多时间和存储空间,因为这些方案都需要有一个相当大的词表和一个复杂的程序。这样一来,信息处理的速度将受很大影响。与外文信息处理相比,我们多了一道徒劳无功的操作。
汉语拼音和词是一对孪生子,采用拼音输入法,词的问题也就自然解决了。汉语拼音的处理速度,可以同其他拼音文字的速度媲美。这就是为什么人们常说 " 汉语拼音是中文信息处理最得力的工具 " 的根本原因。


  拼音输入还有一个优点,拼音只为标准语(普通话)服务,而汉字为所有方言服务。今天,汉字的超方言性对普通话的推广有一定的不良影响,结果使得汉语口语的规范化旷日持久,从而对口语信息的处理和传播(例如问答机的应用)产生明显的阻碍作用,相反地,汉语拼音倒能在很大程度上促进汉语口语规范化。


  2 . 3 要搞好中文现代化,除了在电脑领域推广以汉语拼音为主的双轨制外,还应该在其他方面不断扩大汉语拼音的应用范围,使汉语拼音逐步成为辅助性文字。这是符合我国各族人民当前和长远利益的。


  应该承认,汉语拼音的应用目前还很不充分,比如,很多图书馆的检索法还没有应用汉语拼音。为查一本书要数笔画,查笔形,不但要花费很多时间,而且很容易出漏。如果应用汉语拼音,则会很快查到。又如,外国人地名用汉语拼音转写,再方便不过了。它可以避免一名多译的混乱。但是,这一点尚未被人们认识,以致译名混乱比比皆是。例如,美国前任总统 Bush ,大陆译为 " 布什 " ,台湾叫他 " 布希 " ,香港叫他 " 布殊 " 。英国前任首相 Thatcher 的中文译名更不容易认出,撒切尔(大陆)、柴契尔(台湾)、戴卓尔(香港)。再如,科学技术蓬勃发展的今天,每天都出现大量术语。可翻译这些术语更是令人头疼的事。严复的 " 一名之立,旬月踟蹰 " 虽说是至理名言,但是现在不可能容你那样做。因此,一些纯术语最好用汉语拼音通过转写或标音方式加以音译。另外,汉语拼音在外国人学汉语方面,在注音识字、提前读写方面的潜力也还很大。顺便提一下,编写拼音语法和拼音词典以及增加拼音读物的出版,看来是挖掘潜力的最好途径。以上种种事实说明,汉语拼音大有可为。


  4年前,我在美国东亚语文信息处理国际研讨会( 1990 年 10 月费城宾夕法尼亚大学)上说过,今天我愿在这里再重复一遍: " 我相信, 21 世纪将是汉语拼音充分发挥威力的时代 " 。双文制( digraphia )势在必行,因为计算机时代迫使我们采用双文制。这是不以人的意志为转移的。


× × × × × ×


  最后还想说一个问题,要使中文现代化,还有一个必不可少的条件。这就是国家语委必须充实起来,排除自然主义思想和保守倒退势力的干扰,使自己真正成为语言规划( Language Planning )的坚强领导者。讲到这里,想起了一件事。 1983 年,我们去参加夏威夷华语现代化国际研讨会时遇到一些台湾学者,其中一位土著台湾人对当年台湾强制推行的国语运动耿耿于怀。但大多数台湾学者对国语现在能通行全世界华人社区甚为满意。试想,如果没有当年那次国语运动,恐怕两岸统一道路上又会增加一个严重的语言问题。说真的,要搞语言规划,总要让一部分人改变习惯,这样也许在他们还没认识到这是社会潮流时就觉得是 " 强制 " 。试问,计划生育对一些人来说是不是 " 强制 " 呢?可是没有这样的 " 强制 " 计划行吗?学外语对某些人说,其实也是一种 " 强制 " ,为了达到外企的就业标准而自愿接受这种 " 强制 " 。普通话比外语好学得多,希望普通话早日成为全国公职人员的就业标准。
我的发言完了,谢谢。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值