形态学线索
从词的内部结构可能为这个词分类提供有用的线索。
例如:
-ness与形容词结合可能是一个名词;
-ment是与一些动词结合产生一个名词的后缀;
英语的动词也是形态复杂的。
例如:
-ing有可能是现在分词、也有可能是动名词
句法线索
一个词可能出现的典型上下文
例如:
假设我们已经确定了名词类,我们可以说,英语的形容词的句法标准是可以立即出现在一个名词前,或者紧跟在be或者very的后面
语义线索
一个词的意思对其词汇范畴是一个有用的线索。
新词
比如很多的新词都是名词,这些名词属于开放类;
介词被认为是封闭类,因为只有有限的词汇属于这个类别;
词性标记集中的形态学
例如有的词却有不同的形态,在更细粒度的分词上需要注意:
形式 类别 标记
go 基本 VB
goes 第三人称单数 VBZ
gone 过去分词 VBN
going 动名词 VBG
went 一般过去时 VBD
总之,没有一个“正确的方式”来分配标记,只有根据目标不同或多或少有用的方法。