【其实论文看到一半就觉得好像有点不对劲,因为我们的任务是做wordnet,这个是在已经有了wordnet情况下,根据特定的语料库来提取同义词和反义词……不过我觉得思想应该是差不多的,就继续看了】
【啊看完了,后面要实现的话要用wordnet,提取出候选词,所以我们目前做不到啦】
了解动词之间的潜在关系是很有用的,在不同领域中,在一般上下文中同义的动词可能表示特定上下文中细微但重要的差异(例如在生物医学领域),所以我们的学习不仅要依赖于一般的词典,如WordNet,而且要分析领域特定的文本语料库
动词间关系学习—> 信息提取问题(eg:位置名称提取和下位词提取)
—> 我们可以用基于模式的方法提取
—> 挑战:同一句中,人们使用同义动词的频率远小于使用相关名词和反义动词的频率
前人文献广泛描述了基于模式的信息提取:
1.下位词提取(NP–名词短语 hyponymy relationship–上下义关系 )
eg:
“Students, such as sophomores”— > “学生,如大二学生”
— > 推断出"大二学生"是一种类型的"学生"
上面方法的拓展:[应用于Web级语料库中动词间关系提取]
- 收集高度相关的动词作为候选
2)通过用动词对实例化预定义的模式来制定Web搜索查询
— > 什么叫实例化预定义的模式???
注意点:
动词对与模式同时出现的频率越高,它与模式所指示的关系的可能性就越大。 两种方法都依赖于人为发现的模式,并且不能保证这些模式是全面而完整的。
2.已知事实中探索学习模式。
[使用置信度分数来指定学习模式的良好程度----Ravichandran等人]
与动词对相关联的所有模式中得分最高的模式用于指示一种关系
优点:解决了单个模式的可靠性问题
缺点:当找到具有多个模式的动词对时,如何累积置信度就成为了问题
— > 累积置信度 ???