第五章 实体消歧
实体具有歧义性,体现在两个方面:
- 同一实体在文本中会有不同的指称 ⇒ \Rightarrow ⇒ 指称的多样性
- 相同的实体指称在不同的上下文中可以指不同的实体 ⇒ \Rightarrow ⇒ 指称的歧义性
任务概述
定义
实体消歧可以通过六元组进行定义:
M = N , E , D , O , K , δ M = N,E,D,O,K,\delta M=N,E,D,O,K,δ
- N = n 1 , n 2 , . . . , n l N = n_1,n_2,...,n_l N=n1,n2,...,nl是待消歧的实体名集合
- E = e 1 , e 2 , . . . , e k E = e_1,e_2,...,e_k E=e1,e2,...,ek是待消歧实体名的目标实体列表,包括了所有待消歧实体名可能指向的实体。在实际应用中,目标实体列表通常以知识库的形式给出
- D = d 1 , d 2 , . . . , d n D = d_1,d_2,...,d_n D=d1,d2,...,dn是一个包含了待消歧实体名的文档集
- O = o 1 , o 2 , . . . , o m O = o_1,o_2,...,o_m O=o1,o