通过DNN的情绪指标（sentiment）对测试输入进行排序

最新推荐文章于 2024-02-23 17:32:48 发布

海苔小饼干

最新推荐文章于 2024-02-23 17:32:48 发布

阅读量956

点赞数

分类专栏： TEST FOR AI 文章标签：软件测试测试用例神经网络深度学习 dnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40479372/article/details/124369935

版权

TEST FOR AI 专栏收录该内容

17 篇文章 3 订阅

订阅专栏

本周粗略阅读了论文《Input Prioritization for Testing Neural Networks》，该论文研究了通过DNN的三种情绪指标（sentiment）来对测试输入进行优先级排序的有效性，对今后的研究方向有一定提示。例如，我们可以将文中提到的这些情绪指标糅合到自己的优先级排序方法中，或者将这些指标进行结合，比较它们的效果等等。

由于阅读的是英文原文，有一些词汇不知道如何翻译，所以在括号后标注了原单词。如有不当，欢迎指正。

主要工作：

本文从模型执行的计算中得到 DNN 的情绪量表（sentiment），用于识别可能揭示模型弱点的输入。

据此，评估了三种此类情绪指标——置信度（confidence）、不确定性（uncertainty）和惊喜性（surprise）。结果表明，可以有效标记暴露不可接受的 DNN 行为的输入。

对于 MINIST 模型，正确标记的输入的平均百分比范围为 88% ~ 94.8%。

思想：

将更高的优先级分配给不确定或令人惊讶的输入（因为更可能揭示模型的错误行为）。

相关技术：

三种检查神经网络内部计算以捕获情绪的技术：

softmax输出作为置信度预测：

可直接从softmax输出计算优先级分数。
贝叶斯不确定性：

将估计的不确定性用作分数来确定优先级。
输入惊喜性：

相关概念：惊喜充分性（SA，Surprise Adequacy）

高度惊喜可能表明模型没有为输入做好充分准备，因此获得高分。

实验设计：

比较以上三种优先级方法的性能：

softmax
具有10个和100个蒙特卡洛采样样本的贝叶斯dropout
在最后一层和最后两层测量的基于距离的惊喜充分性（DSA）

海苔小饼干

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
通过DNN的情绪指标（sentiment）对测试输入进行排序

本周粗略阅读了论文《Input Prioritization for Testing Neural Networks》，该论文研究了通过DNN的三种情绪指标（sentiment）来对测试输入进行优先级排序的有效性，对今后的研究方向有一定提示。例如，我们可以将文中提到的这些情绪指标糅合到自己的优先级排序方法中，或者将这些指标进行结合，比较它们的效果等等。由于阅读的是英文原文，有一些词汇不知道如何翻译，所以在括号后标注了原单词。如有不当，欢迎指正。主要工作：本文从模型执行的计算中得到 DNN 的情绪
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

海苔小饼干 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。