NLP—形态还原算法

本文介绍了如何使用NLP处理英语规则动词的形态还原,通过分析字典文件设计单词数据结构,并解决读取过程中的分隔符问题。程序运行过程中,输入单词后,检查其在字典中的词性和释义,再进行形态变化,依据特定规则进行处理。如果处理后的字符串仍存在于字典中,即认为找到了单词的原型。
摘要由CSDN通过智能技术生成

自然语言处理中的形态还原就是把句子中的词还原成基本词形,作为词的其它信息(词典、个性规则)的索引。简单的说,就是把各种时态的单词还原成单词的基本形态。对英语单词进行形态还原,是利用到了给出的规则进行处理。为了简化问题,这里只是给出了部分的还原规则。如下所示。


英语“规则动词”还原

*s -> * (SINGULAR3)
*es -> * (SINGULAR3)
*ies -> *y (SINGULAR3)
*ing -> * (VING)
*ing -> *e (VING)
*ying -> *ie (VING)
*??ing -> *? (VING)
*ed -> * (PAST)(VEN)
*ed -> *e (PAST)(VEN)
*ied -> *y (PAST)(VEN)
*??ed -> *? (PAST)(VEN)
英语不规则动词还原
went -> go (PAST)
gone -> go (VEN)
sat -> sit (PAST) (VEN)


利用这些规则,就可以写程序对单词进行处理,形态还原算法如下。

                
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值