我们知道很多词语都有很多意思或语义,而在具体的语境中,词语有某种特定的意思。而独立于上下文来考虑词语意思,语义一般都会出现语义歧义。统计自然语言处理不得不考虑如何消除歧义问题。
消除歧义的任务就是确定一个多义词在一个特定的语境中使用哪一种语义。通过考虑词汇使用的上下文完全可以确定其具体的语义。那么如何确定一个词汇具有的语义,以及从这些语义确定某一种具体的语义呢?
比较简单的方法是从一部词典中给出某个词汇的定义确定该词汇具有的语义。但对于大部分词汇来说,他们的语义和用法并不是简简单单能够根据词典中的定义来列出,词典中列出的语义之间有一些是可以清晰分辨的内容,但大部分内容都是不确定的,并且是混合在一起的。而更难的一点是,词典中每个词汇只能列出一定数量的语义,而该词汇在实际的语境中定义的语义不一定能够从词典中