第五章 实体消歧 阅读笔记
5.1 任务概述
在实体识别的结果中,一方面,同一实体在文本中会有不同的指称(指称的多样性);另一方面,相同的实体指称在不同的上下文中可以指不同的实体(指称的歧义性)。因此必须对实体识别的结果进行消歧才可以得到准确、无歧义的实体信息。实体消歧的目的是解决文本信息中广泛存在的名字歧异问题。
5.1.1 任务定义
实体消歧可以通过以下六元组进行定义:
M = N . E , D , O , K , δ . M = N.E,D,O,K,\delta. M=N.E,D,O,K,δ. N = n 1 , n 2 , ⋅ ⋅ ⋅ , n l , N=n_1,n_2, \cdot\cdot\cdot,n_l, N=n1,n2,⋅⋅⋅,nl,是待消歧的实体名集合。
E = e 1 , e 2 , ⋅ ⋅ ⋅ , e k , E=e_1,e_2, \cdot\cdot\cdot,e_k, E=e1,e2,⋅⋅⋅,