【关键字】 RIME / 中州韵 / 小狼毫 / 鼠须管 / 同文 输入法 模仿 类似 搜狗输入法 TAB / U 键 拆字 / 拆部首 / 偏旁 / 构件 / 笔画 的配置文件 / YAML
【背景】由于搜狗输入法过于商业化,导致会产生一些较大的风险,使用去广告版更不可取。因此希望使用一种开源的可控度较高的输入法。而RIME输入法虽然满足风险控制要求,但是对于一般人来说,不容易进行配置。因此需要一个能够把搜狗输入法移植到RIME上的方案。
【过程】
方案1:高度类似搜狗输入法的TAB功能
通过正则表达式对输入码进行重组,使其构成为:双拼码+提示词+辅助码(构件读音的双拼)
步骤如下
【图片】佛振教你写 Rime 输入方案之辅助码的作法【rime吧】_百度贴吧 (baidu.com)
方案2:不完全类似搜狗输入法的TAB功能
类似于U键这样的功能,无法整句输入的同时进行辅助码筛选。
现成方案如下
rime-flypy-zrmfast: Rime 输入方案:小鹤双拼+自然快手双形辅助码 (gitee.com)
该作者将U模式的提示词'U'改为了'ab'
个人主观感受:自然码的学习成本较高,懒得学习。宁愿把时间花在折腾输入法本身上,也不愿意学自然码这类强行拆解汉字构件的形码 (指不依照说文解字的规则强行拆解构件,使得汉字形码仅保留了文字形状但丧失其原有指称的行为,尽管说文解字也有强行附会的许多字,但更让人无法接受的是当代工程师在文化继承上面的欠考虑,我宁愿重码多一点输入慢一点也不愿意使用没逻辑强行靠记的输入法) 。尤其是可以使用双拼来指向可拆构件的时候,也没有很强烈的需求去专门学习一个不太直观的输入法。
方案3:
工具清单:ChatGPT、python、excel、互联网搜索引擎
步骤1、获取简繁汉字GBK库所有汉字的合理可拆构件库;
步骤2、将每个构件赋予其造字本义与读音;
步骤3、将每个汉字的构件拆分表替换为构件拆分读音小鹤双拼形式; //以上三个步骤需要文字功底,我直接引用的他人成果,汉字拼音使用[mirtlecn/rime-radical-pinyin: Rime 部件拆字输入方案(全拼双拼) (github.com)]。
步骤4、让GPT编写python表格处理程序,将GBK汉字的读音和构件的双拼按rime-flypy-zrmfast的输入规则整合起来;
//后续考虑把笔画辅助检索也放进这个构件拆分的字典中,因为感觉使用前缀还是比较麻烦。
//由于想要偷懒,所以对于原版小鹤双拼的单韵母部分我采用了双写韵母的方式编码。因为这样偷懒会产生大量的重码,但我不知道怎么解决而且花费的时间较多,所以近期用着没什么问题的话,我也就懒的在折腾这个了。如果后面用的确实重码太高太麻烦了。会想办法把它变换为小鹤双拼原版的编码。之所以麻烦,是因为这个输入法并没有采用RIME的变换处理,而是直接把字典进行小鹤双拼的编码。当然一种可能的解决办法是通过python去进行判断每个韵母前面是否有声母,如果是无声母的,那么就不进行转换即可。
例如:
汉字 | 拼音 | 编码 |
爱 | ai | dd(小鹤拼拆) |
爱 | ai | ai(小鹤双拼) |
步骤5、将rime-flypy-zrmfast的customer文件进行配置,为了拟合搜狗的tab模式,因此修改了无需'['引导的方式。并且将ab前缀功能改成了笔画辅助功能;
步骤6、完成。
备注:我的工作没有啥技术含量,但是为了区分两个输入法的使用方法不同,因此修改了输入法的名称为小鹤拼拆。如果哪里有冒犯或者侵权,请联系我,我会进行修改或者删除,本文仅作为我个人回忆用。
用法:
用户自定义短语:
修改custom_phrase.txt文件可以添加数学符号、语文标点等短语或字符。
前缀模式功能简述:
ac
前缀:小鹤双拼键位查询;
aw
前缀:单词模式;
ae
前缀:emoji 模式;
ap
前缀:临时全拼模式;
ab
前缀:笔画组字模式;