容 错 输 入 |
浑天码允许对单字进行容错输入。所谓容错,是指取码过程有时会产生歧义性,会有不止一种拆分可能,由于拆分的歧义性产生的不同编码称为容错码。允许容错输入可增加汉字输入的适应性; |
容错输入举例 |
例1:离=L亠禸=LIN “离”从字形轮廓上可以看作相对独立的上、下两块,“离”上部构造较复杂,可按字头取一码,然后取下部字块的代码,即“离LIN”; 或 离=L亠凵禸=L文凵禸=L亠凶禸=LIUN “离”也可看成三块,按“亠、凵、禸”或“文、凵、禸”或“亠、凶、禸”取码; 从“离”字的分解取码过程也可以看出,浑天码按字头归并字头的好处在于,对拆分歧义性具有一定弹性空间和包容能力; 例2:高GIN 即(G亠冂) 或 高GION 即(G亠口冂) 考虑到繁体“髙”字头是个整体,可整块取为“亠”的代码I,所以“高”可以有容错码; 例3:足=Z口卜人=ZOLA 或 足=Z口 “足”字脚“ 另外,“”字旁分布于Q键上,如果用户希望“足”取码为Q也可以,则有: 足=Z=ZQ; “足”这样取码这也是可以的。不过,不推荐“足ZQ”这个编码。因为相对O键而言,Q键位置不好,并且“Z、Q”都是左手键位,不如“足ZOL(A)”是左右手互博,用键比较舒适。 |
例1:丐=G下 丂=GFS 或 丐=G正 丂=GES “丐”字可以视为“下 丂”组合,也可视为“正丂”组合; 例2:沔=M氵丏=M氵下丂=MVF(S) 或 沔=M氵丏=M氵正丂=MVE(S) “沔”字右边可以视为“下丂”组合,也可视为“正丂”组合; “丐、沔”两字的相关部分是典型的“笔画简单、构造复杂”的字形,可以让人“抓狂”。浑天码专门给出容错方案,可以取码为ES,也可以取码为FS,类似的字还有“钙、眄”等; |
例1:改=G 从字源的角度上讲“改”为“己攴”组合。“改”是会意字,甲骨文的字形,左边是“己”,右边是“攴”( pū),表示教子改过归正之意。本义:改变; 或 改=G 浑天码给出两种取码方法以容错; |
例1:严=Y 亚厂=YET “严”可视为“亚、厂”组合,“亚、厂”共享了一个笔画; 或 严=Y亚丿=YEP “严”也可视为“亚、丿”组合。不过如果取“严=亚丿”的话,会跟“印=YEP”重码。 推荐大家取“严=Y亚厂=YET”这个编码; 例2:印=Y “印”从字源上讲,左边是一个“爪形”。由于字形的演变,目前的楷体书写这个“爪形”似乎更类E一些,所以取“印=YEP”。 |
例1:武=W戈止=W弋止=WL(U),“武”是二级简码; 或 武=W一弋止=WEL(U) 从字源上讲,“止戈为武”,所以我们推荐:武=WLU; 例2:酆=F山阝=FUP
或 酆=F曲阝=FDP 若不是把字号放大,估计用户都不容易看清楚“酆”的左上角构造。在小字号的情况下,用户容易误认为“酆”左上角是个“曲”,所以我们也给了一个容错码“酆FDP”; |
例1:耍=S而女 =STG 或 耍=S丆冂女=STN(G) 例2:雠=C隹讠隹=CRIR 或 雠=C亻 |
例1:凼=D 氺凵=DJUV “凼”字不常用,如果按“D氺凵”顺序输入,与“抖”重码,对“凼”可加一V键避开重码; 或 凼=D亅 或者,也可以按“D亅 “涵”的左上角取“了”的代码J ; 或 涵=H氵乛凵==HVVU “涵”的左上角取“乛”的代码V; 例3:幽=Y幺幺山=YSSU 或 幽=Y山幺幺=YUSS 类似字还有“豳=B山豕豕=BUMM”或“豳=B豕豕山=BMMU” “幽”这种字形,书写时,究竟是先写“山”还是先写“幺”;取码时,究竟是先取“山”还是先取“幺”,可能会仁者见仁,智者见智 ;我们的 策略是:“不争论”,两个顺序都给它一个容错编码; |
例1:余=Y人于=YAJ 或 余=Y亼朩=YAM 例2:庸=Y广聿冂 =FTF(N)或 庸=F广彐用=FTEN “庸”字下部有交重结构,相对复杂些,不过,只要用户愿意将交重结构看作一些部件的组合,拆分还是容易的; |
关于“威、咸”等字 |
例1:威=W戊女=WLO 或 威=X戊一女=WLEG 咸=X戊口=XLO 或 咸=X戊一口=XLEO 对半包围结构字形,有时可以省一码,这也属于容错; |
关于“臧、藏” |
臧=Z爿戈臣=Z爿戈匚=ZKLC 或 臧=C爿戈臣=C爿戈匚=CKLC “臧”是多音字; 藏=Z艹爿戈=ZHKL 或 藏=C艹爿戈=CHKL “藏”是多音字; 从字源的角度看,“臧”是形声字,臧=戕臣,从臣,戕( qiāng)声; “藏”古通“臧”,藏=艹戕臣,也是合于字源的; 考虑到“臧、藏”字形构造相对复杂,对“臧、藏”这俩字,本输入法也支持如下形式的容错输入: 臧=Z 藏=Z艹 “臧”字头可取“戊”的代码L,“臣”字块可取“匚”的代码C; “藏”是多音字,还有一编码:藏=CHLC; 本例中以“戊”拟合“ |
关于“赢、嬴”“蠃、羸” |
关于“赢、嬴、蠃、羸”,这几个字,如果单字码长限定为四码之内,则无论是拼音码,音形码,全形码处理起来都比较棘手,都会重码。这属于结构性重码,即所谓“惰性重码”。 浑天码仍按常规给出其各自编码: 赢=Y亡口凡=YION 嬴=Y亡口凡=YION 蠃=L亡口凡=LION 羸=L亡口凡=LION 不过,浑天码专门为这几个字设定了一个优化方案,即从中间位置按“上、中、下”来取码使其互不重码: 赢=Y亡口贝=YION 嬴=Y亡口女=YIOG 蠃=L亡口虫=LIOO 羸=L亡口羊=LIOU 事实上,“赢”和“蠃”两字分别是排在提示行第一位置,空格即可上屏,可认为这两字本身并不受重码困扰;只是后两个字“嬴”和“羸”分别与前两个字重码,优化方案主要解决了“嬴”和“羸”这两个字的重码问题; 关于这几个字的引申思考,浑天码拟今后推出大字符集的音形版和全形版,拟考虑码长并不限于四码,则似可应对如此结构性重码问题; |
例1:彦=Y立丿彡=YIPP 或 彦=Y立厂彡=YITP “彦”可视为“立、厂、彡”组合; 或 彦=Y立彡=YIPV 如果“彦”的上部不作拆分,整块取码为I,则“彦”与“遥”前三码相同,对“彦”可追加一V键避开重码,详见重码处理; 例2:睿=R卜火日=RLA(B) 或 睿=R卜日=RLB 或 睿=R卜一日=RLE(B) 注意: 象“彦、睿”这种有多达三个容错码的情况极少,用户不必依赖于容错码。我们知道,浑天码为方便用户,采用了“三码见任一字”安排。用户在实际打字的时候,稍加判断,必要时可以尝试一下可能的编码,一般能很快在提示行见到你想输入的字词。如果不行,用户还可采用“以词定字”等方法来输入单字; |
|