2021深圳杯d题数学建模 基于一个微分对策问题的机器学习能力定量评价

该博客分析了一个基于微分对策的羊犬博弈问题,研究了机器学习在解决此类问题中的应用。任务包括建立犬的最优围堵策略,求解羊在特定条件下逃逸的条件,设计机器学习方法让羊学会逃逸,并提出评价体系。重点介绍了使用随机森林算法训练羊的逃逸路线,并通过模糊综合评价法评估机器学习方法的效果。
摘要由CSDN通过智能技术生成

基于一个微分对策问题的机器学习能力定量评价

由于用机器学习方法求解诸如最优控制、微分对策这样具有连续动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。

一个古老的羊-犬博弈问题:羊在半径为 R 的圆形圈内具有定常速率 v 和满足以下限制的任意转弯能力:逃逸路径上每一点与圆心的距离随时间单调不减。羊逃出圆形圈则胜。犬沿着圆周以定常速率 V 围堵以防止羊逃逸,任何时刻具有选择圆周的两个方向之一的能力。
任务:

  1. 通过运动学精确建模求解犬的最优围堵策略;
  2. 假设犬以最优策略围堵,基于精确建模求解羊可以逃逸胜出
    的条件;
  3. 假设羊理解自己的能力、限制和躲避犬围堵而逃逸的目标,
    但不具备基于运动学的最优化决策知识,假设 2 中羊可以逃
    逸的条件被满足,给出一种机器学习方法,使得羊通过学习
    训练后实现逃逸;
  4. 设计一套评价体系,定量评价 3 中给出的机器学习方法的学
    习能力;
  5. 提出并定量评价更多的羊逃逸机器学习方法

问题分析:

  对于问题一,通过对犬的运动进行分析,可以将其看作匀速圆周运动,对于羊,可以看作原理圆心的运动。通过对比羊犬的速度与场地半径之间的关系,分别建立犬的圆周运动微分方程以及羊的随机运动微分方程,通过羊全的运动范围确定犬的最优围堵方案。(需要列出具体的方程求解)。
  对于问题二,在问题一的条件下,结合羊犬的运动进行分析,分析极限情况下羊被犬抓住的概率,由此确定羊在犬的最优化策略下的胜出条件。
对于问题三,通过对羊的运动轨迹进行分析,结合犬对于羊的限制条件,结合问题一与问题二中的条件,结合随机森林算法对羊的路线进行分析,以羊的运动轨迹坐标作为数据集,建立随机森林模型,使用matlab进行求解,最终得到羊通过训练后实现逃逸的路线。
对于问题四,对羊逃逸学习的随机森林模型进行分析,对羊的运动轨迹、犬的限制以及数据集选取(随机森林模型选取部分数据进行学习)进行分析,采用模糊综合评价分析不同影响因素的判断矩阵,结合matlab得到不同影响因素的权重。并通过影响因素自身的得分得到最终的评价。
对于问题五,通过最优化模型对羊犬博弈问题进行分析,结合问题四建立的模糊综合评价模型进行评价,得到不同的机器学习方法定量评价。对比不同的评价方法,得到适合本文的评价方法。

模型的求解

通过对羊的运动轨迹进行分析,结合犬对于羊的限制条件,结合问题一与问题二中的条件,结合随机森林算法对羊的路线进行分析,以羊的运动轨迹坐标作为数据集,建立随机森林模型,使用 matlab 进行求解,最终得到羊通过训练后实现逃逸的路线。

在这里插入图片描述

部分程序如下所示:

#构造data子集及机器学习框架
'''遇到问题没人解答?小编QQ:917267119'''
import pandas as pd
from sklearn import preprocessing
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值