摘要:
事实核查三个子任务:
1)Verifiable claim detection task distinguishes whether a response carries verifiable factual information;可验证断言探测任务:判断是否有可验证的事实信息
2) Evidence retrieval task retrieves the most relevant Wikipedia snippets as evidence;证据检索任务:检索最相关的维基百科代码片段作为证据;
3) Claim verification task predicts a dialogue response to be supported, refuted, or not enough information。断言验证任务:判断对话相应是正确、错误还是信息不足无法判断。
我们指出了对话事实中的独特挑战,如处理错误分析中的口语化、共引用和检索歧义,以阐明这个方向的未来研究。
Introduction:
三个挑战:
- 口语化:验证对话中主张的事实正确性对数据集的构建和建模都提出了新的挑战。现有数据集中的claim来自正式来源,如新闻文章,它们通常简洁和正式。相比之下,对话中的主张往往是非正式的,而事实内容却很少。此外,对话话语通常包括个人观点、俚语和口语化,这些都需要与事实信息区分开来。
- 对话事实核查的另一个挑战是省略和共引用经常发生,使话语不完整和不明确。
- 歧义?实体消歧和共指消解 虽然根据对话,人们可以很容易地理解带有引用或缺少信息的话语上下文和他们的推理技巧,一个事实核查系统可能需要对这种行为进行显式建模。
模型任务实现:为了验证事实,我们建议通过利用否定、实体交换、语言模型掩码和填充和知识基础生成等技术来创建弱监督的训练数据。我们在这个任务上建立了基准模型的性能,并指出了事实核查模型的弱点。