标题: 错误信息反应框架: 推理读者对新闻标题的反应
期刊: ACL 2022
Contribution:
- 提出错误信息反应框架 (MRF),来模拟读者对新闻标题的反应。
(这里说的反应不只局限于正负面的二分类情感,而是更细微的情感or意图) - 将机器生成的MRF语义与新闻标题一起展示给读者,能够增加真实新闻的可信性、减少虚假新闻的误解性。
Introduction
- 若想有效预测新闻标题如何影响读者,需要了解读者如何看待真假新闻背后的意图。
- 【错误信息反应框架】MRF包括:
- Writer Intent:来自读者对作者意图的解释(读者认为作者是怎么想的)
【举例:“有些口罩比其他口罩好。”】 - Reader Perception:读者对新闻标题的反应
(include emotional reactions and observations)
【举例:“feeling angry.”】 - Reader Action:看到标题后读者会怎么做(重点在action).【举例:买口罩】
- Likelihood of Spread:衡量新闻被分享的可能性。【举例:4/5】
- Perceived Label:感知标签,即读者认为该新闻是真or假。【real】
- Gold Label:新闻的客观真实性。
- Writer Intent:来自读者对作者意图的解释(读者认为作者是怎么想的)
语料库
构建语料库包括两个步骤:新闻标题收集,众包注释。
Modeling Reaction Frames(建模反应框架)
在大规模语言模型上进行建模:
对于自由文本推理(如作者意图,读者感知):用生成式语言模型–T5/GPT2。
对于分类推理(如新闻真假标签):使用生成模型或基于Bert的判别模型。
Controlled Generation
对于生成模型(用于推断任务),采用以下输入序列:
h:长度为T的新闻标题
St:话题控制向量
Sd:控制维度(是MRF中的哪个)
x:输出为代表预测推断结果的短序列
推断:
We predict each token of the output inference starting from the topic token St until the [eos] special token is generated.
用beam search进行解码,因为:beam search are known to be less diverse but more factually aligned with the context.
分类
对于分类模型,使用以下输入序列: