语义熵(1为0.5 的间隔):“双向蕴含”(bidirectional entailment)是判断两个句子是否语义等价的核心标准
在论文《Detecting hallucinations in large language models using semantic entropy》中,“双向蕴含”(bidirectional entailment)是判断两个句子是否语义等价的核心标准。简单来说,就是两个句子能“互相推导”——如果句子A成立能推出句子B成立,且句子B成立能推出句子A成立,就认为它们语义等价。
双向蕴含的定义
- 蕴含(Entailment):若句子A为真时,句子B一定为真,则A“蕴含”B。
例如:A=“他买了苹果和香蕉”,B=“他买了水果”——A为真时B必为真,因此A蕴含B。 - 双向蕴含:A蕴含B,且B蕴含A。此时A和B在核心语义上完全一致,只是表达方式可能不同。
举例说明双向蕴含的判断
以论文中“埃菲尔铁塔在哪里?”的问答为例,模型生成的不同答案需通过双向蕴含判断是否语义等价:
例1:语义等价的双向蕴含
- 句子A:“巴黎”
- 句子B:“法国的首都是巴黎”