自然语言处理中的形态还原就是把句子中的词还原成基本词形,作为词的其它信息(词典、个性规则)的索引。简单的说,就是把各种时态的单词还原成单词的基本形态。对英语单词进行形态还原,是利用到了给出的规则进行处理。为了简化问题,这里只是给出了部分的还原规则。如下所示。
英语“规则动词”还原
*s -> * (SINGULAR3)
*es -> * (SINGULAR3)
*ies -> *y (SINGULAR3)
*ing -> * (VING)
*ing -> *e (VING)
*ying -> *ie (VING)
*??ing -> *? (VING)
*ed -> * (PAST)(VEN)
*ed -> *e (PAST)(VEN)
*ied -> *y (PAST)(VEN)
*??ed -> *? (PAST)(VEN)
英语不规则动词还原
went -> go (PAST)
gone -> go (VEN)
sat -> sit (PAST) (VEN)
利用这些规则,就可以写程序对单词进行处理,形态还原算法如下。