T9输入法的实现

原创 2012年03月30日 11:11:04

T9输入法,名字听起来陌生,可是大家却经常使用它。可以说T9输入法是输入法历史中的一次革命。至少自T9输入法开始,输入法有长足的进步。
如图手机中九个数字键。26个英文字母被分配到2至9这8个数字键上。以前想输入英文单词的时候总是需要连续多次按某个键,才能得到目标字母。比如想输入“hello”,就需要按两次4,两次3,三次5,三次5,三次6.输入一个单词需要数十次的按键,更何况还有经常按错的情况。编辑一条短信非常麻烦。
T9输入法很好的解决了这一问题。用户利用9个数字键输入非常杂的英文单词并且不用重复按某个字符。系统将会根据已有词库找出可能性最大的单词。例如,目标单词为“hello”,只需输入4,3,5,5,6即可,系统会自动过滤掉不合法的单词如“gdjjm”。排除非法单词,只考虑合法单词,这样大大加速了输入速度。
然而这只是第一步,因为每次输入数字之后,可能有多个候选单词前缀与此匹配。这就需要按可能性提供可能性最大的(最常用)的英文单词。比如系统已知两个单词:"idea","hello"。idea最常用(可能度最高)。那么当依次输入4,3,5,5,6时,对于每次按键系统给出的候选单词应该是:
i (4)
id (3)
hel (5)
hell (5)
hello (6)
这样的话,通过T9输入法就可以大大提高输入速度和简洁度。
如何实现T9输入法呢?
(1)建立词库
将大量单词储备起来便于快速查找,字典树无疑是很好的选择。每个节点将存储此前缀的可能度,结构如下:

/*
 * 字典树
 */
public class Trie {
	
	public Node root = new Node();//字典树根节点
	
	public class Node{
		public int probablity;
		public Node[] next;
	
		public Node() {
			this.probablity = 0;
			next = new Node[26];
		}
	}
	
	public void insert(String str, int probablity){
		Node p = root;
		int i = 0;
		for(i = 0; i < str.length(); i++){
			if(p.next[str.charAt(i) - 'a'] != null){
				p = p.next[str.charAt(i) - 'a'];
				p.probablity += probablity;
			} else {
				Node q = new Node();
				q.probablity = probablity;
				p.next[str.charAt(i) - 'a'] = q;
				p = p.next[str.charAt(i) - 'a'];
			}
		}
	}
	
	public int search(String str){
		Node p = root;
		int i = 0;
		for(i = 0; i < str.length(); i++){
			if(p.next[str.charAt(i) - 'a'] != null){
				p = p.next[str.charAt(i) - 'a'];
			} else {
				return 0;
			}
		}
		return p.probablity;
	}
	
}



(2)查找
建立好的字典树,每个节点最多有26个孩子分别代表下一个字符。当给出一个查找串“43556”的时候,利用广度优先遍历来搜索长度x的所有前缀的可能度。找出最大的即可。广搜的时候要用到队列。
举例模拟过程:
当输入4(g,h,i)之后,通过字典树遍历发现只有"h","i",找出可能读最大的输出(i),并将h,i都入队。
输入3(d,e,f)后,拿出队列中的"h",分别组成"hd","he","hf",去字典树中查,将其中合法串入队,记录最大可能度对应串。再将h出队。对"i"做同样操作。最终找出最大的可能读最大串。
……
可以看出广搜的过程中大量剪枝,以及常用单词的长度最多不过十几个字母。所以字典树的深度也是十几,加上大量剪枝,性能还不错。

static int[][] ref = {	//手机键盘数字-字母映射表
	{0},
	{0},
	{3, 0, 1, 2},//按钮2,三个字母a,b,c
	{3, 3, 4, 5},
	{3, 6, 7, 8},
	{3, 9, 10, 11},
	{3, 12, 13, 14},
	{4, 15, 16, 17, 18},
	{3, 19, 20, 21},
	{4, 22, 23, 24, 25}
};
public static Queue<String> queue = new LinkedList<String>();	//用于广度优先遍历过程中的队列
public static Trie trie;	//字典树
	
public static void BFS(String str){
	queue.clear();
	queue.offer("");
		
	int i = 0;
	for(i = 0; '1' != str.charAt(i); i++){
		int max_probablity = 0; //最大可能性值
		String probaStr = "";
		int pre_amount = queue.size(); //队列中之前串的个数
		int j = 0;
		for(j = 0; j < pre_amount; j++){
			int k = 0;
			String preStr = queue.peek();
			for(k = 1; k <= ref[str.charAt(i) - '0'][0]; k++){
				String tempStr = preStr.concat((char)(ref[str.charAt(i) - '0'][k] + 97) + "");
				if(trie.search(tempStr) > 0){
					queue.offer(tempStr);
				}
				if(trie.search(tempStr) > max_probablity){
					max_probablity = trie.search(tempStr);
					probaStr = tempStr; 
				}
					
			}
			queue.poll();
		}
		if("".equals(probaStr)){
			break;
		} else {
			System.out.println(probaStr);
		}
	}
	while('1' != str.charAt(i++)){
		System.out.println("MANUALLY");
	}
		
}



思考:
1.以上模拟过程只是给出最大可能度的串,也可以按可能度将所有匹配串按顺序都给出,然后由用户选择。
2.感觉T9输入法打破了之前输入法的僵局,虽然只是用在手机输入。但是个人认为当前流行的智能键盘输入法也采用了类似的处理。比如利用搜狗输入法依次输入"hao""zi""wei""zhi"
给出的最大候选依次为:“好”“耗子”“好滋味”“好自为之”。是不是有点T9输入法的味道?如果有兴趣的话可以交流讨论!

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

【模拟】智能T9英文输入法

智能T9英文输入法 (phone.pas/in/out) Problem 某款新型手机为了方便用户,希望开发一种新的英文输入法.要求在输入英文的时候输入法不但能够做到自动联想,还能进行自动纠错....

LintCode-二叉树中的最大路径和

给出一棵二叉树,寻找一条路径使其路径和最大,路径可以在任一节点中开始和结束(路径和为两个节点之间所在路径上的节点权值之和) 样例 给出一棵二叉树: 1 / ...

找一个二叉树的最大路径和

题目: 找一个二叉树的最大路径和,该二叉树没有其他的特征,元素大小val是整数,可正可负,输入根节点,输出最大路径和。 解题思路: 首先一条路径遍历到叶子节点的时候,两个叶子节点的根节点相同,也...

T9输入法 实现一个Android输入法

作者:韩梦飞沙 QQ:313134555 T9输入法手机智能输入法实现原理和步骤_西西软件资讯 实现一个Android输入法 | IT瘾

android T9 搜索联系人分析与实现(支持多音字)

最近在项目开发过程中
  • ZJQYJG
  • ZJQYJG
  • 2014-11-16 23:02
  • 3153

Android拨号盘,支持T9搜索和号码搜索

之前做通讯录软件,其中在做拨号盘的时候一直为怎么实现T9输入烦恼,上网找了很多帖子,都没有满意的答案。不过最后终于是实现了,看社区内好像也有不少朋友需要,在此分享一下。这个是在我项目中提取出来的拨号盘...

Android Launcher T9搜索APP实现

Launcher T9搜索

实现ucGUI界面中的拼音汉字输入法(T9)

实现ucGUI界面中的汉字输入法  ucGUI版本:3.94 上个图片 码表是在网上找到的.  主要三个文件:  T9mb.h 汉字的码表 T9.h T9.c 实现一个方法检索T9mb.h里的汉字...
  • jhting
  • jhting
  • 2012-09-27 09:54
  • 58721

T9 输入法C源码 TC实现 MCU

  • 2009-05-21 16:12
  • 184KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)