ADP
文章平均质量分 69
WanderingSIN
这个作者很懒,什么都没留下…
展开
-
python 调用Matlab
python 调用 matlab原创 2022-03-31 22:21:13 · 1722 阅读 · 0 评论 -
自适应动态规划(五)-初值不为零的值迭代
初值不为零的值迭代稳定性证明定理一问题描述假设初值为任意半正定函数V0(xk)=Ψ(xk)V_0(x_k)=\Psi(x_k)V0(xk)=Ψ(xk)定义变量 γ‾,γ‾,δ‾\underline{\gamma},\overline{\gamma},\underline{\delta}γ,γ,δ 和δ‾\overline{\delta}δ 变量如下:KaTeX parse error: No such environment: equation at position 8: \原创 2020-11-06 15:02:02 · 1271 阅读 · 3 评论 -
自适应动态规划(四)-离散策略迭代证明
策略迭代策略迭代稳定性证明单调不增的证明迭代过程取一个随机容许初始控制律v0(xk)v_0(x_k)v0(xk)V0(xk)=U(xk,v0(xk))+V0(xk+1)V_0(x_k)=U(x_k,v_0(x_k))+V_0(x_{k+1})V0(xk)=U(xk,v0(xk))+V0(xk+1)在更新控制律v1(xk)=argminuk{U(xk,uk)+V0(xk+1)}v_1(x_k)=\arg \min_{u_k}\{{U(x_k,u_k)+V_0(x_{k原创 2020-11-06 14:57:33 · 1642 阅读 · 4 评论 -
自适应动态规划(二)
自适应动态规划(二)贝尔曼公式和离散LQR一个离散系统x(k+1)=Ax(k)+Bu(k)x(k+1)=Ax(k)+Bu(k)x(k+1)=Ax(k)+Bu(k)性能指标函数J(k)=12∑i=k∞(xT(i)Qx(i)+uT(i)Ru(i))J(k)=\frac{1}{2}\sum_{i=k}^{\infty}(x^T(i)Qx(i)+u^T(i)Ru(i))J(k)=21i=k∑∞(xT(i)Qx(i)+uT(i)Ru(i))由贝尔曼方程可知V(x(k))=12∑i=k∞(xT原创 2020-10-10 08:31:44 · 5123 阅读 · 15 评论 -
自适应动态规划(一)
自适应动态规划(一)先立一个flag,这个算法我一定要研究透彻,连续更新。动态规划参考书籍《最优控制理论与系统》第四章 动态规划递推方程JN(x)=minSN(x){d[x,sN(x)]+JN−1[SN(x)]}J1(x)=d(x,F)J_N(x)=\min_{S_N(x)}\{d[x,s_N(x)]+J_{N-1}[S_N(x)]\} \\J_1(x)=d(x,F)JN(x)=SN(x)min{d[x,sN(x)]+JN−1[SN(x)]}J1(x)=d(x,F)最原创 2020-10-08 09:42:52 · 16234 阅读 · 24 评论