贝尔曼方程(Bellman Equation)也被称作动态规划方程(Dynamic Programming Equation)。此方程把“决策问题在特定时间怎么的值”以“来自初始选择的报酬比从初始选择衍生的决策问题的值”的形式表示。借此这个方式把动态最佳化问题变成简单的子问题,而这些子问题遵守从贝尔曼所提出来的“最佳化还原理”[1]。
最优化原理一个最优策略,具有如下性质:不论初始状态和初始决策(第一步决策)如何,以第一步决策所形成的阶段和状态作为初始条件来考虑时,余下的决策对余下的问题而言也必构成最优策略。
其中,
是状态变量向量,
是控制变量,
是时间变量,
根据贝尔曼最优原理,以上求解可以转化为:
以上式子最优化问题为:
最优条件为:
一阶条件:
包络引理为:
1.家庭部门决策一生效用最大化问题,
基本形式可以描述为:
此时,控制变量为
,状态变量为
,此时状态方程可以表示为:
初始状态给定,
,
,而其后任意时间的状态变量数值都是可变的。
定义值函数为:
所以,任意阶段t的贝尔曼方程就可以表示为
动态最优解路径为:
进一步求解可以得到:
均衡条件下:
进一步化简可以得到:
以上方程为动态规划最优化条件欧拉方程。
2. 异质性实物资本模型求解最优化:
基本形式可以描述为:
生产函数为:
此时资源约束方程为:
此时,控制变量为
,状态变量为
此时状态方程可以表示为:
初始状态给定,
,
,
,而其后任意时间的状态变量数值都是可变的。
定义值函数为:
所以,任意阶段t的贝尔曼方程就可以表示为
动态最优解路径为:
进一步求解可以得到:
均衡条件下:
进一步化简可以得到:
以上方程为动态规划最优化条件欧拉方程。
参考
- ^https://baike.baidu.com/item/%E8%B4%9D%E5%B0%94%E6%9B%BC%E6%96%B9%E7%A8%8B/5500990?fr=aladdin