NumerSense: Probing Numerical Commonsense Knowledge of Pre-trained Language Models

最新推荐文章于 2024-08-30 12:54:54 发布

xiaomao979

最新推荐文章于 2024-08-30 12:54:54 发布

阅读量200

点赞数

分类专栏：常识生成文章标签：深度学习人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43173180/article/details/108979000

版权

常识生成专栏收录该内容

2 篇文章 0 订阅

订阅专栏

论文目的

调查研究了预训练模型是否可以得出数字常识知识，若可以那么可以理解到什么程度，以及该过程的鲁棒性，同时构建了数字常识知识数据集NUMERSENSE

NUMERSENSE构建过程

从OMCS抽取含{“no”, “zero”, “one”, “two”, …, “ten” }其中任意一个单词的句子。为了降低噪音，作者手工和务实地修改了这些句子，并由不同的研究生进行了两轮审查，作者只保留了所有注释者接受的陈述。
为了检测模型的鲁棒性，我们还在我们的数据集添加了对抗性的例子，即在每个检测中涉及数值推理的名词之前添加形容词
作者还手动注释了每个实例的类别标签，以便能够更好地理解所涵盖的主题及其百分比

检验过程

使用最先进的预训练模型（BERT,RoBerta,GPT2)进行实验
改成问答模型，使用最先进的commonsenseQA模型进行实验

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
NumerSense: Probing Numerical Commonsense Knowledge of Pre-trained Language Models

论文目的调查研究了预训练模型是否可以得出数字常识知识，若可以那么可以理解到什么程度，以及该过程的鲁棒性，同时构建了数字常识知识数据集NUMERSENSENUMERSENSE构建过程从OMCS抽取含{“no”, “zero”, “one”, “two”, …, “ten” }其中任意一个单词的句子。为了降低噪音，作者手工和务实地修改了这些句子，并由不同的研究生进行了两轮审查，作者只保留了所有注释者接受的陈述。为了检测模型的鲁棒性，我们还在我们的数据集添加了对抗性的例子，即在每个检测中涉及数值推理
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。