输入法 原理

转自 《电脑爱好者》2014第9期 妙手生花的背后——输入法原理解密
http://m.cfan.com.cn/article/65

文字输入过程主要是:
输入编码,然后根据编码选择所需字符的过程。
因此Windows系统下汉字输入法实际就是:将输入的标准ASCII字符串(英文字符),按照一定的(编码规则)转换为汉字或词组。在将英文字符转换成汉字的过程中,码表文件(字库)起到了关键作用,码表文件有点类似英汉词典,将特定组合的英文字符与汉语字词一一对应起来。
如下图的搜狗字库:
这里写图片描述

要是的输入法高效,应该要满足一下几个条件:

1.全面才会准确

日常使用中我们需要输入一些生僻字、网络流行语,如果输入法的字库不够全面的话就无法输入。现在的输入法一方面借助本地字库,另一方面则充分发挥“云字库”优势,可以将生僻字、网络流行语等一网打尽。

云字库:应该会保留最近用户的输入记录吧,当过了一段时间,某一条记录达到一定的频次,应该就会作为本地字库保留下来。而那些长时间频次只是很小的,可能就会被作为错词剔除。

2.输入法“猜你喜欢” 个性化

好的词库还需要搭配智能的算法,只有依靠智能算法才能将字库的功能充分发挥出来。现在大多数输入法能够自动分析用户的输入,选择和调整接下来文字显示的优先级,这样既可以可以大大降低词语拼错的可能性,同时方便用户高效选择输入,这种功能的实现是借助输入法后台强大的算法实现的。比如搜狗输入法,在你首次输入“dnahz”并选择“电脑爱好者”后,它就会“记忆”下你的选择,等再次输入“dnahz”,它就会智能判断你可能要输入“电脑爱好者”,于是将这一词组调整到优先选择的位置。如果你多次输入“dnahz”但选择的是不同的词组,这时输入法的算法程序会根据你选择的频率(选的最多),将你最有可能想要的结果放在优先的位置

3.统计是智能算法的核心

上面的根据词频调整,已经具有初步的学习功能了,而优秀的输入法还可以(智能联想、智能纠错、智能组句)。有时我们会发现,刚刚输入一两个字母,输入法就已经给出我们想要的长长的词组,非常智能。这些看起来有些神秘,但它们的算法核心其实很简单,就是统计。

聊天、写作、打报告,你每天究竟打了多少字,也许你自己并不清楚,但你所用的输入法却在默默地记录着,你每一次的输入每一次的选择,都会纳入它统计的数据中,正是根据这些数据分析得出你常用的词语,以及你特殊的喜好和选择。所以,并非输入法“聪明”,而是我们自己“出卖”了自己。

4.输入法搞“兼职”

除了识别编码的输入,现在输入法的扩展功能也越来越多。一方面是扩展字符的输入方式,比如为了方便用户输入不会读音但会写的汉字,搜狗输入法提供了手写组件,启动该组件后只要使用鼠标将字写出来,我们就可以在识别框进行选择输入
怎么得到候选的匹配字形?

另一方面则将输入法和其他相关的功能关联起来,比如谷歌输入法就整合其强大的搜索功能,在输入需要搜索的关键字后,只要点击状态栏的谷歌图标,这样即可自动打开谷歌的搜索页面进行搜索

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值