python根据特定词分类_【语言处理与Python】5.7如何确定一个词的分类

形态学线索

从词的内部结构可能为这个词分类提供有用的线索。

例如:

-ness与形容词结合可能是一个名词;

-ment是与一些动词结合产生一个名词的后缀;

英语的动词也是形态复杂的。

例如:

-ing有可能是现在分词、也有可能是动名词

句法线索

一个词可能出现的典型上下文

例如:

假设我们已经确定了名词类,我们可以说,英语的形容词的句法标准是可以立即出现在一个名词前,或者紧跟在be或者very的后面

语义线索

一个词的意思对其词汇范畴是一个有用的线索。

新词

比如很多的新词都是名词,这些名词属于开放类;

介词被认为是封闭类,因为只有有限的词汇属于这个类别;

词性标记集中的形态学

例如有的词却有不同的形态,在更细粒度的分词上需要注意:

形式 类别 标记

go 基本 VB

goes 第三人称单数 VBZ

gone 过去分词 VBN

going 动名词 VBG

went 一般过去时 VBD

总之,没有一个“正确的方式”来分配标记,只有根据目标不同或多或少有用的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值