鲁棒性、抗干扰性和强化学习泛化性的不同


参考文献

[1] 提高模型鲁棒性的一些方法


先说结论,二者有关系,但是不一样。


一、鲁棒性 robust

鲁棒性是控制中的词语,主要指某些参数发生改变或者控制量偏离最优值的时候系统仍能够保持一定的稳定性和有效性。

鲁棒性强调的是控制器(agent)的结构的本身特征。

系统对于自身 内部的改变所收受到的影响程度,比如所设计的控制器,当被控对象的尺寸发生改变时候,仍然能够进行控制,此时,说明所设计的控制器鲁棒性很强。

鲁棒性包括稳定鲁棒性和品质鲁棒性。

二、抗扰性 anti-disturbance

外部的干扰对系统所受到的影响的程度,比如外部出现噪声,此时,控制器任然可以保持较好的稳定性,说明抗干扰能力强。

知乎有个例子张智
机器人行走来说,

三、强化学习的泛化性

根据有限样本得到的网络模型对其他变量域也有良好的预测能力。强调的是网络对数据的处理性能,强调的是从部分抽样的数据中能够提取出数据分布的结构特征。

此处的鲁棒性可以理解为训练出来的agent对变化的容忍程度。假设数据出现较小偏差时候,只对模型输出产生较小的影响,或者没有影响,则可以称为此agent是具有鲁棒性的。

和鲁棒性的对比:

鲁棒性指自己主动改变网络中的相关参数,细微修改模型,也能够得到理想的效果。
泛化性值不主动修改网络中的参数,被动接受不同的外界输入,也可以得到理想的效果。

四、总结

当机器人走在坑洼不平的路上,且可以走的很好,则说明抗干扰性好;

当机器人掉了一条腿,还能走的很好,则称之为鲁棒性好。

干扰性外部,鲁棒性内部。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值