动态规划(学习笔记)
一. 多阶段决策过程的最优化问题例题:(最短路径问题)
给出了一个地图。地图中的每个顶点代表一个城市。两个城市间的一条违线代表道路连线上的数值代表道路的长度。现在想从城市人到达城市E.怎样走路程最短?最短路程的长度是多少?
解:
题目分析:分阶段:A到B到C到D到E,4(K)个阶段。
设:
JK(a,b)表示K阶段从a到b的距离
FK(c)表示从K阶段的c到终点E的最短距离
现选择倒推的方法:
E到D: K=4 F4(D1)=3,F4(D2)=4,F4(D3)=3
E到C: K=3
F3(C1)=min{ J3(C1,D1)+F4(D1) ,J3(C1,D2)+F4(D2) }=8
F3(C2)=J3(C2,D1)+F4(D2)=8 F3(C3)=J3(C3,D3)+F4(D3)=11
F3(C4)=J3(C4,D3)+F4(D4)=6
E到B: K=2
F2(B1)=min{ J2(B1,C1)+F3(C1), J2(B1,C2)+F3(C2), J2(B1,C3)+F3(C3) }=9
F2(B2)=min{ J2(B2,C2)+F3(C2), J2(B2,C4)+F3(C4) }=10
E到B: K=1
F1(A)=min{ J1(A,B1)+F2(B1), J1(A,B2)+F2(B2) }=13
即:得到最短距离:13
看完解题全过程,可以发现本类型的解法:每一个阶段x或每一步决策 x
f(x)=初始状态+过程;(重点)
在上列的多阶段决策问题中,各个阶段采取的决策,一般来说是与阶段有关的.决策依最于当前状态,又随即引起状态的转移,一个决兼序列就是在变化的状态中产生出来的,故有“动态”的含义,我们称这种解决多阶段决策最优化的过程为动态规划程序设计方法。