二维动态规划降维误差一般为多少_一种多维多阶段复杂决策问题的均匀动态规划方法...

一种多维多阶段复杂决策问题的均匀动态规划方法

【专利摘要】本发明属于水电优化调度运行领域,公开了一种多维多阶段复杂决策问题的均匀动态规划方法。本发明以动态规划为基础框架,在对各时段不同维度离散状态进行组合时,采用均匀试验设计仅选取少数极具代表性的状态组合进行迭代计算,逐次逼近全局最优解,有效降低动态规划时间复杂度和空间复杂度,大幅提升计算效率,为多维多阶段复杂决策问题的求解提供了一种新型有效方法。

【专利说明】一种多维多阶段复杂决策问题的均匀动态规划方法

【技术领域】

[0001] 本发明涉及水电系统决策优化领域,特别涉及一种多维多阶段复杂决策问题的均 匀动态规划方法。 技术背景

[0002] 多维多阶段决策问题普遍存在于水利、交通、经济等复杂巨系统的最优控制及生 产调度中,通常涉及到庞大复杂的目标和约束条件,很难对目标和约束条件分解,因此大多 无法选择解析式优化方法,通常选用对目标函数和约束条件无严格要求的动态规划进行求 解。动态规划将复杂高维决策问题通过分段降维转化为一系列结构相似的简单低维子问 题,利用各阶段之间的关联关系递归求解,能够同时获得全局最优解及各子过程的最优解, 有利于对结果进行分析。然而随着状态变量与决策变量维数的增加,动态规划计算量与存 储量均呈指数增长,受限于现有计算机存储容量和计算速度,常常无法解算。

[0003] 为克服这一问题,国内外学者对动态规划开展多方面的探索,提出一系列以逐次 渐进逼近理论为核心的改进方法,如旨在减少维数的动态规划逐次逼近算法,旨在减少离 散状态数的离散微分动态规划,旨在减少优化阶段数的逐步优化算法。这些方法在不同程 度上提高了动态规划计算效率,但在求解大规模复杂决策问题时存在仍会面对"维数灾"问 题,难以保证在合理时间内获得高质量的优化解。

[0004] 均匀试验设计是我国数学家方开泰和王元利用数论在多维数值积分中的应用原 理创立的多因素多水平试验设计方法。它着重考虑试验点在试验范围内的充分均衡分布, 力求通过最少的试验次数获得最多的信息,通过合理安排试验实现各因素每个水平仅做一 次试验,在大幅减少试验次数的同时保证所选试验点具有良好的代表性,从而提高试验结 果的精确性与可靠性。

[0005] 均匀试验设计采用精心设计的均匀设计表安排试验方案,记为Um(Cf),其中U表示 均匀设计,q为设计水平数,s为设计因素数,m为试验次数,m = q。均匀设计表为q行s列 的矩阵,即〃" '丨,各行分别表示一种均匀试验设计方案;各列涵盖相应因素所有 可能水平;表示第i项试验方案中因素 j相应水平,G {1,2,…,q}。

[0006] 从表1可以看出,均匀设计表具有以下特点:(1)各列不同数字只出现一次,即各 因素的不同水平仅做一次试验。(2)任意两因素相应水平有且仅需开展一次试验。(3)均 匀设计将试验次数降至水平数的一次方数量级,即试验次数与试验水平数相同,工作量大 幅减少且具有良好的连续性。由此可知,采用均匀设计表安安排试验,仅需极少数试验即能 反映客观事物的主要特征。

[0007] 表均匀设计表 [0008]

【权利要求】

1. 一种多维多阶段复杂决策问题的均匀动态规划方法,其特征包括如下步骤: (1) 设定状态离散数目q和终止精度e; (2) 根据维度N及状态离散数目q选取合适均匀设计表;问题维度总数为N,阶段总数 为T; (3) 设定初始试验轨迹f )w及搜索步长,=,其中心、< 分别表示 第i维第j时段的初始状态及初始搜索步长; (4) 由各维各时段当前状态Z°、状态离散增量△ °及均匀设计表构造各时段状态组合; (5) 根据实际问题修正各时段所有状态组合至可行域; (6) 利用常规动态规划和惩罚函数法在各时段的状态组合中获取较优轨迹Z1 ; (7) 判定计算前后轨迹Z1与Z°是否相同,若相同则转至步骤(9);否则转至步骤(8); (8) 判定Z1是否优于Z°,若优则更新初始轨迹,令Z° =Z1,否则不进行操作,然后返回 步骤(4); (9) 判定离散增量是否满足精度要求,若满足则转至步骤(10);否则缩小状态离散增 量,然后转至步骤(4); (10) 停止计算,输出最优轨迹Z°。

【文档编号】G06Q50/06GK104408531SQ201410723960

【公开日】2015年3月11日 申请日期:2014年12月2日 优先权日:2014年12月2日

【发明者】程春田, 冯仲恺, 牛文静, 廖胜利, 武新宇, 李刚, 申建建, 曾筠 申请人:大连理工大学

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值