最近刚好在入门美赛,所以做了一些笔记~
视频:美赛冲刺课12节
1.建模步骤:
(①不要怕难题,难题获奖概率可能更大 ②每个人也许都应该学习一些Matlab编程)
模型准备 → 模型假设 → 模型建立 → 模型求解(Matlab编程) → 模型分析(图的表面、图深层含义的分析) → 模型检验(知识储备+已经调查的数据进行推断预测) → 模型应用(可以解决哪些问题)
2.数学建模有哪些问题?
①数据处理(获取数据,数据处理)#插值与拟合 ②关联与分析(根据数据进行关联和分析) ③分类与判别
④评价与决策 ⑤预测与预报 ⑥优化与控制
(1)数据处理 [ 数据出现缺失/异常值 --插值与拟合 ]
比如题中只给出了部分地点的高程
①插值拟合:
主要用于对数据的不全和基本趋势分析
②小波分析,聚类分析(高斯混合聚类,K-均值聚类等)
主要用于诊断数据异常值并进行剔除
③主成分分析、线性判别分析、局部保留投影等
主要用于多维数据的降维处理,减少数据多余
④均值、方差分析、协方差分析等统计方法
主要用于数据的截取或特征选择
(2) 关联与因果
①灰色关联分析方法(样本点的个数较少)
②Superman或kendall等级相关分析
③Person相关(样本点的个数比较多)
④Copula相关(比较难,金融数学,概率密度)
⑤典型相关分析(自变量X1234,因变量Y1234,各自变量相关性较强,哪些因变量与哪些自变量的关系比较紧密)
(3)分类与判别
#对DNA的序列进行分类,对所属关系进行判别
SOM难度较大,可以用
①距离聚类(高斯聚类,系统聚类)常用 #距离类的概念
②关联性聚类
③层次聚类 #一堆数据,暂无距离类概念用34等
④密度聚类
⑤其他聚类
⑥贝叶斯判别(统计判别方法)
⑦费舍尔判别(训练样本较少)
⑧模糊识别
(4)评价与决策(都可以用神经网络)
#对于全球水资源的评价?
①模糊综合评判:评价一个对象优良中差等层次评价,评价一个学校等,不能排序 (无明显数据分层,模糊)
②主成分分析:评价多个对象的水平并排序,指标间关联性很强
③层次分析法:做决策,通过指标,综合考虑做决定 [low]
④数据包络分析法DEA:优化问题 (比如智慧城市政策运行情况的评价
⑤秩和比综合评价法:评价
⑥⭐神经网络评价:多指标 非线性关系明确的评价
#比如水质应该与多种指标有关….但是没有明确的线性关系
⑦优劣解距离法
⑧投影寻踪综合评价法:糅合多种算法(遗传算法、最优化理论)
⑨方差分析、协方差分析等
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产
量有无影响,差异量的多少;(1992年作物生长的施肥问题)
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因
素,但注意初始数据的量纲以及初始情况。(2006年,艾滋病疗法的评价以及
预测问题)
(5)预测与预报
#eg SARS的传播;
方法
①小样本内部预测 #基本不考
②大样本内部预测 #基本不考
③小样本未来预测 #容易考 最常用 灰色预测模型
④大样本的随机因素或周期特征的未来预测
⑤大样本的未来预测
模型
①灰色预测模型(必须掌握)
满足两个条件可用:
a.数据样本点个数少,6-15个
b.数据呈现指数或曲线的形式
②微分方程预测(备用)
无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据之间的关系
③回归分析预测(必须掌握)
求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量如何变化;
样本点的个数有要求:
a自变量之间协方差比较小,最好趋于零,自变量间的关系小;
b样本点的个数n>3k+1,k为自变量的个数;
c因变量要符合正态分布
④马尔科夫预测(备用)
一个序列之间没有信息的传递,前后没有联系,数据与数据之间随机性强,相互不影响;今天的温度与昨天、后天没有直接联系,预测后天温度高、中、低的概率,只能得到概率
#和之前没有什么关系,只和现在有关,比如说一种新的政策
⑤时间序列预测(必须掌握)
与马尔科夫预测互补,至少有2个点需要信息的传递,ARMA模型,周
期模型,季节模型等。
⑥小波分析预测
⑦神经网络预测
⑧混沌序列预测
## 样本很多时用67
(6)优化与控制
#eg.公交车调度,生产线,怎么找一个最优方案; 或者说试验台的控制器,怎么设计;各个地方运输(线性规划等规划类问题),美赛浴缸设计(?)
①线性规划、整数规划、0-1规划(有约束,确定的目标)
#运输问题..
②非线性规划与智能优化算法
#非线性因素
③多目标规划和目标规划(柔性约束,目标含糊,超过)
#要达到多个目标,省钱省力,很多条件..
④动态规划
⑤图论、网络优化(多因素交错复杂)
#给了一个图,规划出一个路线;(如大坝的选址问题)
⑥排队论与计算机仿真
#排队,怎么安排顾客关系
⑦模糊规划(范围约束)
⑧灰色规划(难)
(智能算法选讲)
遗传算法:交叉变异,使更有利于环境生存的性状存留
模拟退火:随机性。对于不想要的结果给一个比较小的概率。
粒子群算法: