模型预测控制的缺点_控制与人生: 上篇规划篇 (2) 模型预测控制和反馈学习...

385e4fd093a54cb3f4a10f43c30516bf.png

上一节讲到了动态规划,这节我们讲一下模型预测控制(model predictive control)和反馈学习(feedback learning)。还是先看一个例子。
小A决定一个月之内写一篇文章,思路有了,技术上也没问题,每周写两三页基本可以完成。小A详细规划了一下每周写什么,第一周顺利执行。然而第二周刚开始时,老家突然有急事,必须赶回去处理一下。一来一回耽误了三天,原来的计划也被打断。他重新审视了一下原计划,只剩下两个半星期,如果好好安排一下其他事情,文章还是可以完成,新计划需要剩下每周完成三四页。小A又认真工作了一个星期,发现竟然赶超进度,基本上都写完了。剩下最后十天小A又重新制定计划,在原有的基础上添加了一些新的想法,文章看上去也比预想的更加完美。
模型预测控制的核心思想是在当前时间寻找未来一段时间 T 的最优解,但是仅仅执行一小段时间 t,等 t 时间过去之后再重新基于当前时间的最新信息寻找未来 T 时间的最优解,并仅仅执行 t 时间,以此类推。这样做的本质原因是我们生活中往往计划不如变化,因此需要根据当下最新的环境、信息,及时调整策略。

施姐:有点意思。那 T 和 t 该怎么取呢?

施弟:厉害了呀,一针见血地提出了这么深奥的问题?

施姐:哪里哪里,略懂略懂。

我们拟定计划的 T 以及 t 非常重要,太长则不足以反映现实之不确定性和种种随机因素带来的冲击,太短则计划过密,往往最后一事无成,因为制定计划可是一件令人兴奋的事情。看着满满的日程表和 to do list,即便一件没有完成,制定完的那一瞬间幸福感还是爆棚的。

施姐:说了等于白说,还是没说明白 T 和 t 该怎么取。

施弟:。。。

施姐:饶了你吧。那你说说这个和 PID 控制有啥区别?

施弟:哎哟,看来你课后不仅复习了,还预习了啊?

施姐:哪里哪里,略花一点时间而已。

模型预测控制,顾名思义,带了预测的功能,模型越精确,其控制效果越好,T 和 t 也可以选择更长。一般朝九晚五坐办公室的员工,或者一些做重复性劳动的工人,他们的工作计划往往可以制定到几个月甚至于几年后,而一些咨询公司员工的计划可以短到按照几天制定。原因就在于前者的工作环境变化缓慢(精确模型)而后者变化迅速(模糊模型)。经典的 PID 控制却不带预测功能。

模型预测控制和 PID 控制都利用了反馈 (feedback)。如果只能列举一个词来说明控制学科的话,我投票给反馈——这是控制理论的基础和精华之所在。

施姐:那反馈怎么用在平时的生活中呢?

反馈的思想非常强大。生活中,我们不仅需要向前看,拟定各种计划(通过动态规划以及模型预测控制),我们更要静心思考,反思自己过去一段时间的得与失。

举个例子,我们学期前的目标是科科拿A+,结果成绩公布了,门门C+,如此大的反差(控制术语叫做预设值和实际值之间的误差 error)是怎样造成的呢?我们该如何改善呢?是学习方法有问题还是时间投入不够?抑或是其他因素呢?

再比如,一个人经常闷闷不乐,易怒,脾气大,爱生气,那一定是某些方面出了问题。这个时候就要常想想哪里出问题了,是在自己身上,还是在别人身上?又分别需要如何解决?(这是另外一个大的课题,内容超出本篇之外,以后有机会再详细阐述。)

我给学生们的建议是反馈学习一定要及时。曾子曰:吾日三省吾身。要求每天都反省三次严格了一点,也没必要。一个学期反思一次则太久,或许很多都已忘却。年轻时消化、吸收信息的能力最为强大,每天都可能有明显的进步,此时每周反思一次最佳。仔细思考一下过去一周哪些地方做得不错,哪些地方还有欠缺,哪些地方做得糟糕。好的习惯继续保持,不良的习惯努力改之;成功的经验发扬光大,失败的例子汲取教训。失败了不怕,怕就怕重复犯同样的错。另外,我们经常嘴上说说容易,真正做的时候却有诸多借口,所以纵使明白了千千万万的道理,仍却过不好自己的小小人生。

施姐:说得好!可我感觉每天都忙忙碌碌,一年到头也没时间静心冥想,日子就这么稀里糊涂地过去了,怎么破?

施弟:设闹钟,设提醒,固定每周某一天的早上8-9点用来反思,雷打不动地贯彻执行。

施姐:太早了,我还在睡觉,不行。

施弟:那晚上8-9点吧。

施姐:吃饭时间,不行。

施弟:。。。

课后作业:

(1) 你过去一周开心的时刻有哪些?不开心呢?为什么开心或不开心呢?

(2) 你未来一个月有什么计划?打算如何执行呢?

控制与人生: 上篇-规划篇 (1) 动态规划

控制与人生:序

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值