标准的字根输入法设想

  国家新版《汉字部首表》即将于5月1日发布,其中:主部首 201 个,附形部首 99 个。

 

  每个部首都是有读音的,因此可以用部首的声母做码元,笔划也有读音,不需要用数字表示。

 

  一直没有学形码市场中的王者——五笔(其实相比更合理的应该是郑码),一是感觉它太繁琐,更重要的是觉得它的拆字不合汉字内在的文化意义,怕自己习惯一种错误的思维。

 

  用拼音输入法好多年了,紫光拼音,感觉还不错,只是有时选一些不常用字麻烦了些——重码太多了。

 

  前几天,同事问一字如何写,虽不常用,也不生僻,自己却半天想不起来!查拼音……原来如此简单,自己本来会写的。

 

  于是有些吃惊(尚未至大汗淋漓),啊……已经好多年没去想念字形了,虽童子功深,但多年失忆下来,有不少字都是月光下的凤尾竹——渐渐的模糊了。愧!

 

  希望有个形码的输入法,拆字完全合理,所以思考了些日子,整理出如下条目:

 


<xx形声输入法> 功能和用户界面设计
===============================================================================

字根:

  采用国家新版《汉字部首表》中部首为字根。计:主部首 201 个,附形部首 99 个。

  要点:不添加任何自定义字根,完整采用标准部首作为字根。

字根取码:

  1.
  简码:
  取字根标准拼音之首字符(一般为声母)为码,下面也称之为读音码。
  注:
  笔画归总为六类:横(h)、竖(s)、撇(p)、捺(n)(点)、折(z)、勾(g)。“折”笔指向左弯折(勾),“勾”笔指向右弯折(勾)。
  单笔画字取笔画码和字读音码,以形成至少 2 个码位。如“乙”字,取:勾(g) + 乙(y),编码为:gy。

  2.
  全码:
  取标准读音全拼(含声调)和其在《汉字部首表》中的序号(码尾3位数)组成唯一识别符。

拆字:

  1.
  作为文字的规范信息,采用标准的汉字拆字规则,请参考国家新版《部首归部规范》。

  2.
  在现实的输入法码表中,接受容易错拆的常用字的容错拆分。


===============================================================================

<实现相关>

特点:

  规范拆字,标准字根(即国家标准《汉字部首表》内容)。
  以词为主,短句为辅,单字优先级最低(有单独的单字输入模式,支持拼音)。
  逐键智能组词组句,自动记忆选取词汇
  可配置词频调整和候选词条数。
  多模式快捷切换,方便输入疑难字和各种符号。

编码:

  1.
  单字 - 全码:主部首全码 + 按笔序其它字根全码。(文字信息资料)
  单字 - 简码:主部首简码 + 按笔序其它字根简码。
  单字 - 拼音:标准全拼,不含声调。(注:可配置模糊音)

  2.
  词组:仅用单字简码中的前 2 个码进行编码。
  编码:1 + 1 + ……  即分别取各字简码中的前 1 个码(主部首读音码)组合。
  优化:
  对两字词增加 2 + 2 取码方式,即分别取两个字简码中的前 2 个码组合。

  3.
  高频字简码,除 i u v 之外的 23 个英文字符(码元)对应 23 个高频字。

功能:

  1.
  普通模式:
  调用输入法正常输入文字。因拼音首字符只用到 23 个字母,英文键盘上 i u v 未用,所以这 3 个字母被用作扩展模式。
  除单双引号外,主键盘标点符号转换由文件定义,用户可以修改配置。

  2.
  扩展模式:

  首次键入 i、u、v 即进入相应模式(小写)。

  > I
    垂直式候选框,0 - 9 功能选单。

    -

    单字输入(默认,直接输入即是)。支持全码、简码、拼音。

    行中有该字读音和拆分部件列表提示(可按 Shift + num 将提示信息一并输出)。


    0

    部件查询。(首项,可空格选定)。

    按笔画数排序,翻页浏览。提示信息包含部件全码、笔画码(书写笔序)。也可输入部件拼音快速查询。


    1

    函数字串:支持部分 C 函数格式化输出。
    如定义 date 为当前日期编码,则在该选项下输入 date 出现候选词表,可选择当前日期的各种格式串。


    4

    成语输入。
    为简拼码(仅由各字读音码组成),用于知道读音但对组成字不清楚的情况。
    也可用于普通词组,拼音编码。
    此模式下不具备智能组词功能,但有词频调整。

  > U
    模拟软键盘。水平式 0 - 9 功能选单。可翻页以提供多于 10 个的软键盘。
    0   默认选中,一般为常用符号。与 I 的默认不同,此处提供选单键,便于切换回来。
    1 - 9   隐藏的软键盘,选中才显示。

  注:
    因为有数字选单,考虑方便性和适用程度,软键盘不包含数字键一行的键位。

  > V
    英文输入模式(会比切换输入法快一些)。
    键入 v 进入临时英文模式,支持空格编辑(即空格不作提交键),Enter 键提交。

  注:
    普通模式下首先键入大写字母也进入临时英文模式,但只支持单词,空格提交。


容错:

  习惯拆字:在现实的输入法码表中,接受容易错拆的常用字的容错拆分。

 

 

候选框:

 

  水平式候选框参照紫光输入法。

 

  垂直式候选框词条数可配置,并可配置底色,分3个区域:首行、中间部分、尾行,这样使得瞬间目视(一目多行)即可判断词汇有无或位置。(瞬间判词的能力可能因人而异,故候选词条数应可配置)

 

  效果见下图:

 

  5 条词汇:




 

 背景双色:简洁清新。

 

 背景三色:两相似色,简洁。 背景三色:强对比,一目了然。

 

  6 条词汇:




 

 背景双色:简洁清新。

 

 背景三色:两相似色,简洁。 背景三色:强对比,一目了然。

 

 

===============================================================================

 

附言:

 

  很早就学 C++,也想自己写个输入法程序,但好像编写输入法程序的中文相关资料十分的希缺,感觉这真是件怪事——中文输入可是国人进入信息世界的第一道必经门槛啊!这第一道大门怎如此的难以琢磨?罢了,谁叫俺英文差呢,在目下这简体中文的汉语大环境里,没有英语的天赋或成长环境,既便你逻辑思维异常严密、数学成绩高高挺立,综合思考能力杰出卓越,也别想去窥程序员的宝座,别想把现实的事物转化为机器的逻辑,或者,充其量,慢慢爬吧…………做个蜗牛或乌龟。(不是骂人,龟兔赛跑的故事记得吧?我就是只乌龟,不过是只执着的乌龟)

 

  自己也准备攻一下 SCIM 的接口文档,看能否借助这个通用的输入法平台快捷的写个输入法引擎。但字词编码要花些苦力了。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值