五笔字型输入规则-温故而知新-CSDN博客

1、单字的编码规则

　　（1）“键面字”输入法

　　一张“字根总表”，把全部汉字划分成了两大部分。总表里边有的，是专门用来组成总表以外汉字用的，称为“键面字”或“成字字根”相当于“原子”。总表里边没有的，全部是由字根组合而成的，称为“键外字”或“复合字”，相当于“分子”。现在，我们按照前述汉字分解之原则：“汉字分解为字根，字根分解为笔画”，先来学习“键面字”或“成字字根”的编码输入法。

　　●   键名输入

　　各个键上的第一个字根，即“助记词” 中打头的那个字根，我们称之为“键名”。这个作为“键名”的汉字，其输入方法是：把所在的键连打四下（不再打空格键），例：

　　王：王王王王   11 11 11 11 （G G G G）
    又：又又又又   54 54 54 54 （C C C C）
    如此，把每一个键都连打4下，即可输入25个作为键名的汉字。

　　●    成字字根输入

　　① 成字字根：字根总表之中，键名以外自身也是汉字的字根谓之“成字字根”，简称“成字根”。除键名外，成字根一共有97个（其中包括相当于汉字的“氵、亻、勹、刂”等）。

　　 ② 成字根的输入法：先打一下它所在的键（称之为“报户口”）再根据“字根拆成单笔画”的原则，打它的第一个单笔画、第二个单笔画以及其最后一个单笔画，不足4键时，加打一次空格键。现举例如下表

　　成字根  报户口   第一单笔   第二单笔  最末单笔   所击键位
    文文  (Y）  、 (Y）  一  (G）  、 (Y）  41  41  11  41  Y  Y  G  Y
    用用 (E）丿  (T）乙  (N） │ (H）  33  31  51  21 E   T   N  H
    亻亻 (W）丿  (T）丨  （H）  34  31  21 W  T  H  空格
    厂厂（D）一  （G）丿  （T） │  13  11  31 D  G  T  空格
    车车（L）一  （G）乙  （N）丨  （H） 24  11  51  21 L  G  N   H

　　③单笔画输入

　　许多人不太注意，其实5种单笔画“一、丨、丿、丶、乙”，在国家标准中都是作为汉字来对待的。在“五笔字型”中，照理说它们应当按照“成字根” 的方法输入，除“一”之外，其它几个都很不常用，按“成字根”的打法，它们的编码只有2码，这么简短的“码”用于如此不常用的“字”，真是太可惜了！于是，我们将其简短的编码让位给更常用的字，却人为地在其正常码的后边，加两个“L”作为5个单笔画的编码：

　　例：一：GGLL         丶：YYLL
    丨：HHLL         乙：NNLL
    丿：TtLL
    应当说明，“一”是一个极为常用的字，每次都打4下岂不慢事？别担心，后边会讲到，“一”还有一个“高频字”码，即打一个“G”再打一个空格便可输入。

　　（2）“键外字”输入法

　　凡是“字根总表”上没有的汉字，即“键外字”，都可以认为是由表内的字根拼合而成的，故称之为“合体字”——相当于“分子”。按照前述汉字分解的总原则——“汉字拆成字根”。我们首先应毫不客气、毫无例外地将一切“合体字”拆成若干个字根。

　　 ●   合体字的拆分原则

　　合体字的拆分原则

　  　① 书写顺序：拆分“合体字”时，一定要按照正确的书写顺序进行。
    例：“新”只能拆成“立、木、斤”，不能拆成“立、斤、木” “中”只能拆成“口、丨”，不能拆成“丨、口”；“夷”只能拆成“一、弓、人”，不能拆成“大、弓”。

　　② 取大优先：“取大优先”，也叫做“优先取大”。按书写顺序拆分汉字时，应以“再添一个笔画便不能成其为字根”为限，每次都拆取一个“尽可能大”的，即尽可能笔画多的字根。

　例1：世：第一种拆法：一、凵、乙（误）

　　第二种拆法：廿、乙    （正）

　　显然，前者是错误的，因为其第二个字根“凵”，完全可以向前“凑”到“一”上，形成一个“更大”的已知字根“廿”。

　例2：制：第一种拆法：、一、冂、丨、刂  （误）
第二种拆法：、冂、丨、刂      （正）

　　同样，第一种拆法是错误的。因为第二码的“一”，作为“”后一个笔画，全可以向前“凑”，与第一个字根“”凑成“更大”一点的字根“”。总之，“取大优先”，俗称“尽量往前凑”，是一个在汉字拆分中最常用到的基本原则。至于什么才算“大”，“大”到什么程度才到“边”，这要等熟悉了字根总表，便不会出错误了。

　　 ③ 兼顾直观：在拆分汉字时，为了照顾汉字字根的完整性，有时不得不暂且牺牲一下“书写顺序”和“取大优先”的原则，形成个别例外的情况。

　　例1：国：按“书写顺序”应拆成：“冂、王、丶、一”，但这样便破坏了汉字构造的直观性，故只好违背“书写顺序”，拆作“囗、王、丶”了。

　　例2：自：按“取大优先”应拆成：“亻、乙、三”，但这样拆，不仅不直观，而且也有悖于“自”字的字源（这个字的字源是“一个手指指着鼻子”）                故只能拆作“丿、目”，这叫做“兼顾直观”。

　　④ 能连不交：请看以下拆分实例：
    于：一  十    （二者是相连的）    二  丨    （二者是相交的）
    丑：乙  土    （二者是相连的）    刀  二    （二者是相交的）
    当一个字既可拆成相连的几个部分，也可拆成相交的几个部分时，我们认为“相连”的拆法是正确的。因为一般来说，“连”比“交”更为“直观”。

　⑤ 能散不连：

　A、笔画和字根之间，字根与字根之间的关系，可以分为“散”、“连”和“交”的三种关系。
    如：倡：三个字根之间是“散”的关系；
    自：首笔“丿”与“目”之间是“连”的关系；
    夷：“一”、“弓”与“人”是“交”的关系。

　B、字根之间的关系，决定了汉字的字型（上下、左右、杂合）。

　　（A）几个字根都“交”“连”在一起的，如“夷”、“丙” 等，便肯定是“杂合型”，属于“3”型字，不会有争议。而散根结构必定是“1”型或“2”型字。

　　（B）值得注意的是，有时候一个汉字被拆成的几个部分都是复笔字根（不是单笔画），它们之间的关系，在“散”和“连”之间模棱两可。

　如：占：卜  口  两者按“连”处理，便是杂合型（3型）。
    两者按“散”处理，便是上下型（2型正确）。
    严：一  厂  后两者按“连”处理，便是杂合型（3型）
    后两者按“散”处理，便是上下型（2型正确）。
    当遇到这种既能“散”，又能“连”的情况时．我们规定：只要不是单笔画，一律按“能散不连”判别之。因此，以上两例中的“占”和“严”，都被认为是“上下型”字（2型）。

　　（C）作为以上这些规定，是为了保证编码体系的严整性。实际上，用得上后三条规定的字只是极少数。

　　●   “多根字”的取码规则

　　所谓“多根字”，是指按照规定拆分之后，总数多于4个字根的字。这种字，不管拆出了几个字根，我们只按顺序取其第一、二、三及最末一个字根，俗称“一二三末”，共取四个码。
    如：戆：立早夂心   42  22  31  51 （UJTN）

　　 ●   “四根字”的取码规则

　　“四根字”是指刚好由四个字根构成的字，其取码方法是依照书写顺序把四个字根取完。
    如：照：日刀口灬   22  53  23  44 （JVKO）
    低：亻  七丶   34  35  15  41 （WQAY）

　　●   不足四根字的取码规则

　　当一个字拆不够4个字根时，它的输入编码是：先打完字根码，再追加一个 “末笔字型识别码”，简称“识别码”。

　　①“识别码”的组成：它是由“末笔”代号加“字型”代号而构成的一个附加码。由于教不得法，以前许多人对“识别码”望而生畏。其实，按如下做法，你只要5分钟定能学会：

　 A、 “1”型（左右型）字：字根打完之后，补打1个末笔画即等同于加了“识别码”。
    例：  沐：氵木丶（“”为末笔，补１个“”）
汀：氵丁丨（“丨”为末笔，补１个“丨”）
    洒：氵西一（“一”为末笔，补１个“一”）

　　 B、 “2”型（上下型）字：字根打完之后，补打由2个末笔画复合构成的“字根”即等同于加了“识别码”。

　例：  华：亻匕十（末笔为“丨”，2型，补打“”作为“识别码”）
    字：宀子二（末笔为“一”，2型，补打“二”作为“识别码”）
    参：厶大彡（末笔为“丿”，2型，补打“”作为“识别码”）

　　  C、 “3”型（杂合型）字：字根打完之后，补打由3个末笔画复合而成的“字根”即等同于加了“识别码”。

　　例：  同：冂一口三（末笔为“一”，3型，补打“三”作为“识别码”）

　　　　串：口口（末笔为“丨”，3型，补打“”作为“识别码”）

　　　　国：囗王丶氵（末笔为“丶”，3型，补打“氵”作为“识别码”）至于为什么这些“笔画”可以起到“识别码”的作用，你只要仔细研究一下区位号的设计与“识别码”的定义便会恍然大悟。

　　② 关于“末笔”的几项说明：

　　 A、关于“力、刀、九、匕”。鉴于这些字根的笔顺常常因人而异，“五笔字型”中特别规定，当它们参加“识别”时，一律以其“伸”得最长的“折”笔作为末笔。
    如：   男：田力       （末笔为“乙”，２型）
    花：艹亻匕    （末笔为“乙”，２型）

　　 B、带“框框”的“国、团”与带走之的“进、远、延”等，因为是一个部分被另一个部分包围，我们规定：视被包围部分的“末笔”为“末笔”。
    如：   进：二刂辶 （末笔“丨”3型，加“”作为“识别码”）
    远：二儿辶巛（末笔“乙”3型，加“巛”作为“识别码”）
    团：囗十丿彡（末笔“丿”３型，加“彡”作为“识别码”）
    哉：十戈口三（末笔“一”３型，加“三”作为“识别码”）

　C、“我”“戋”“成”等字的“末笔”，由于因人而异，故遵从“从上到下”的原则，一律规定撇“丿”为其末笔。
    如：   我：丿扌乙丿（TRNT，取一二三末，只取4码）
    戋：戋一一丿（GGGT，成字根，先“报户口”再取1、2、末笔）
    成：厂乙乙丿（DNNT，取一二三末，只取4码）

　　 D、单独点：对于“义、太、勺”等字中的“单独点”，离字根的距离很难确定，可远可近，我们干脆认为这种“单独点”与其附近的字根是“相连”的。既然“连”在一起，便属于杂合型（３型）。其中“义”的笔顺，还需按上述“从上到下”的原则，认为是“先点后撇”。
    如：   义：丶  氵（末笔为“丶”３型，“氵”即为识别码）
    太：大丶氵（末笔为“丶”３型，“氵”即为识别码）
    勺：勹丶氵（末笔为“丶”３型，“氵”即为识别码）

　　2、词语的编码规则

　　1982 年底，“五笔字型”首创了汉字的词语，依形编码、字码词码体例一致、不须换档的实用化词语输入法。不管多长的词语，一律取四码。而且单字和词语可以混合输入，不用换挡或其它附加操作，谓之“字词兼容”。其取码方法为：

　1、两字词：每字取其全码的前两码组成，共四码。
    如：经济：纟又氵文（55 54 43 41 XCIY）
    操作：扌口亻  （32 23 34 31 RKWT）

　 2、三字词：前两字各取一码，最后一字取两码，共四码。
    如：计算机：讠竹木几（41 31 14 25 YTSM）
    操作员：扌亻口贝（32 34 23 25 RWKM）

　 3、四字词：每字各取全码的第一码。
    如：科学技术：禾  扌木（31 43 32 14 TIRS）
    汉字编码：氵宀纟石（43 45 55 13 IPXD）
    王码电脑：王石曰月（11 13 22 33 GDJE）

　4、多字词：取第一、二、三及末一个汉字的第一码，共四码。
    如：电子计算机：曰子讠木（22 52 41 14 JBYS）
    中华人民共和国：口亻人囗（23 34 34 24 KWWL）
    美利坚合众国： 禾  囗（42 31 22 24 UTJL）
    五笔字型计算机汉字输入技术：五竹一木（11 31 11 14 GTGS）

　　另外，在WINDOWS版五笔字型输入法中，系统为用户提供了15000条常用词组，此外，用户还可以使用系统提供的造词软件另造新词，或直接在编辑文本的过程中从屏幕上“取字造词”，所有新造的词，系统都会自动给出正确的输入外码合并入原词库统一使用。

转载于:https://www.cnblogs.com/glaivelee/archive/2009/09/24/1573207.html