鲁棒性、抗干扰性和强化学习泛化性的不同

D_JQ

已于 2022-11-20 16:24:08 修改

阅读量1.6k

点赞数

分类专栏：控制理论文章标签： python

于 2022-11-20 15:29:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dumao0620/article/details/127949193

版权

控制理论专栏收录该内容

2 篇文章

订阅专栏

参考文献

[1] 提高模型鲁棒性的一些方法

文章目录

参考文献
一、鲁棒性 robust
二、抗扰性 anti-disturbance
三、强化学习的泛化性
四、总结

先说结论，二者有关系，但是不一样。

一、鲁棒性 robust

鲁棒性是控制中的词语，主要指某些参数发生改变或者控制量偏离最优值的时候系统仍能够保持一定的稳定性和有效性。

鲁棒性强调的是控制器（agent）的结构的本身特征。

系统对于自身内部的改变所收受到的影响程度，比如所设计的控制器，当被控对象的尺寸发生改变时候，仍然能够进行控制，此时，说明所设计的控制器鲁棒性很强。

鲁棒性包括稳定鲁棒性和品质鲁棒性。

二、抗扰性 anti-disturbance

外部的干扰对系统所受到的影响的程度，比如外部出现噪声，此时，控制器任然可以保持较好的稳定性，说明抗干扰能力强。

知乎有个例子张智
机器人行走来说，

三、强化学习的泛化性

根据有限样本得到的网络模型对其他变量域也有良好的预测能力。强调的是网络对数据的处理性能，强调的是从部分抽样的数据中能够提取出数据分布的结构特征。

此处的鲁棒性可以理解为训练出来的agent对变化的容忍程度。假设数据出现较小偏差时候，只对模型输出产生较小的影响，或者没有影响，则可以称为此agent是具有鲁棒性的。

和鲁棒性的对比：

鲁棒性指自己主动改变网络中的相关参数，细微修改模型，也能够得到理想的效果。
泛化性值不主动修改网络中的参数，被动接受不同的外界输入，也可以得到理想的效果。

四、总结

当机器人走在坑洼不平的路上，且可以走的很好，则说明抗干扰性好；

当机器人掉了一条腿，还能走的很好，则称之为鲁棒性好。

干扰性外部，鲁棒性内部。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。