数学建模算法学习

静妮子i

已于 2022-02-17 19:01:06 修改

阅读量3.9k

点赞数 3

分类专栏：数学建模文章标签：算法数学建模

于 2022-01-18 16:43:50 首次发布

本文链接：https://blog.csdn.net/qq_39848541/article/details/122514672

版权

数学建模专栏收录该内容

1 篇文章 1 订阅

订阅专栏

清风数学建模

综合评价问题
1.1 层次分析法AHP
1.2 TOPSIS法
1.3 模糊综合评价（国内比赛用的比较多，暂时不看）

数据处理
2.1 插值算法
2.2 拟合算法

相关性分析
3.1 皮尔逊相关系数
3.2 斯皮尔曼等级相关系数
3.3 典型相关性分析

图论
4.1 Dijkstra算法
4.2 Bellman Ford算法

回归分析
5.1 多元线性回归分析

系统分析问题

文章目录

清风数学建模
一、层次分析法
- 1.1层次分析法模型部分
- 1.1层次分析法代码部分
二、TOPSIS法
- 2.1 TOPSIS法模型部分
- 2.2 TOPSIS法代码部分
三、插值算法
- 一维插值问题
- n维插值问题（了解）
- 插值方法用于短期预测但不建议
四、拟合算法
- 确定拟合曲线
- 求解拟合参数
- - 最小二乘法
- 评价拟合函数
相关系数
- 相关概念(概率论)
- 皮尔逊相关系数的计算：
- 处理数据示例
- - 首先对数据进行描述性统计
  - 计算皮尔逊相关系数
- 假设检验
- 斯皮尔曼相关系数（没有通过正态性检验的情况下）
- - - 斯皮尔曼相关系数的假设检验
- 比较与总结
典型相关分析（不太理解）
- 典型相关分析的定义
- 典型相关分析的思路
图论最短路
- 图的基本概念
- 单源最短路
- Dijkstra算法
- Bellman-Ford算法
- matlab计算最短路径
- 多源最短路
- Floyd算法
回归分析
- 回归分析概念
- 回归分析分类
- 回归分析任务
- 数据的分类
- 数据的收集
多元线性回归分析
- 一元线性回归
- 回归系数的解释
- 举例进行回归分析
- - - 题目描述
    - 使用软件
蒙特卡洛模拟
- 定义：
- 应用：
- - 求解有约束的非线性规划问题
- 01规划问题
- 导弹追踪问题
- 旅行商问题
数学规划模型
- 概述
- 线性规划问题求解
- 线性规划典型例题
- 整数规划
- - 整数规划的典型例题：
- 非线性规划问题
- - matlab求解非线性规划
- 最大最小化模型
- 多目标规划模型
分类模型
- 逻辑回归
- Fisher线性判别分析
- 多分类问题
聚类问题
- K-means聚类算法
- 系统（层次）聚类
- 基于密度的聚类算法dbscan算法
时间序列分析
- 指数平滑模型
- - simple模型
- 线性趋势模型
- 简单季节性模型
- - 温特加法模型
  - 温特乘法模型
- 时间序列建模过程
预测模型

一、层次分析法

1.1层次分析法模型部分

层次分析法的定义：
在这里插入图片描述

引入现实问题：
评价类问题可用打分解决，针对不同指标得到权重打分表（如下图），
在这里插入图片描述

“确定评价指标，形成评价体系，选择最佳方案”——>评价类问题

解决评价类问题的出发点：

评价目标
为达到目标的可选方案
评价准则/指标（自行分析）
一般而言，前两者显而易见，对于评价指标的分析需要我们根据题目中的背景材料，常识以及网上搜集到的参考资料进行结合，从中筛选出最合适的指标。
网络参考资料来源：优先知网，万方，百度学术等学术平台搜索相关文献（一个综合搜索平台：虫部落）

查询资料确定评价指标后，确定指标权重
不能直接主观地去分配权重：一次性考虑五个指标之间的关系，往往考虑不周。
在这里插入图片描述

解决方法：
两个两个指标进行比较，最终根据两两比较的结果推算出权重。
——层次分析法
在这里插入图片描述

通过QA方式对评价指标进行两两比较，如下图示在这里插入图片描述

得到判断矩阵结果：在这里插入图片描述

但是，这种方式得出的判断矩阵可能会出现不一致现象如下在这里插入图片描述

正确情况应当如下图示：
在这里插入图片描述

一致矩阵的特点：各行/各列之间成倍数关系（简便判断方法）
在这里插入图片描述

由于可能存在的不一致问题，故求得判断矩阵后一定要进行一致性检验
原理：检验我们构造的判断矩阵和一致矩阵是否有太大差别
在这里插入图片描述

一致性检验的步骤：

计算一致性指标CI
$\frac{{\lambda}_{max}-n}{n-1}$
查找对应的平均随机一致性指标RI
计算一致性比例CR
$\frac{CI}{RI}$
(如果CR<0.1,可认为判断矩阵一致性可以接受，否则需要对判断矩阵进行修正)

在这里插入图片描述

根据一致矩阵计算权重
在这里插入图片描述

若无法得到一致矩阵，根据判断矩阵计算权重：
在这里插入图片描述

方法一、算术平均法求权重

将判断矩阵按照列归一化（每个元素除以所在列和）
将归一化的各列相加（按列求和）
将相加后得到的向量中每个元素除以n即可得到权重向量

方法二、几何平均法求权重

将判断矩阵A的元素按
将归一化的各列相加（按列求和）
将相加后得到的向量中每个元素除以n即可得到权重向量

方法三：特征值法求权重
一致矩阵特性：有一个特征值为n,其余特征值均为0
且当特征值为n时，对应特征向量刚好为一致矩阵的第一列在这里插入图片描述

在比赛中，特征值法求判断矩阵权重较为常见，可利用代码快速求得
求得指标权重后即可填入权重矩阵，得到最终得分如下图
在这里插入图片描述

层次分析法步骤：

分析系统中各因素之间的关系，将决策的目标、考虑的因素（决策准则）和决策对象按照他们之间的相互关系分为目标层，准则层，方案层，建立系统的递阶层次结构如下：
（要放到论文中的！）
对于同一层次上的各元素关于上一层次中某一准则的重要性进行两两比较（采用相对尺度，以尽可能减少性质不同因素相互比较的困难，以提高准确度），构造两两比较矩阵（判断矩阵）
由判断矩阵计算被比较元素对于该准则的相对权重，并进行一致性检验（检验通过权重才能用）
有三种方法计算权重：（三种全用！）
计算各层元素对系统目标的合成权重，并进行排序

PS：可以通过流程图将方法步骤展现出来（简洁明了不易查重）例如：
在这里插入图片描述

层次分析法的局限性：

评价的决策层不能太多，n太大的话，判断矩阵和一致性矩阵差异可能会很大
若决策层指标数据已知，不必再用层次分析法

模型扩展

在这里插入图片描述对于准则层的指标有多个子指标的情况：
将权重相乘得到子指标在总情况下的权重

1.1层次分析法代码部分

二、TOPSIS法

TOPSIS法：逼近理想解排序法又称优劣解距离法
一种常用的综合评价方法，能充分利用原始数据的信息，结果能精确反映各评价方案之间的差距。
在这里插入图片描述

2.1 TOPSIS法模型部分

问题引入：

在这里插入图片描述
正常情况下，我们按照分数进行排名，排名高即排名数小，但是在这里要求的评分应当是排名高评分高，所以不可用寻常方式进行排名，我们需要对排名进行修正，如下进行了简单的倒序排列。

仅通过这样的方法进行排名的修正，存在不合理之处：
在这里插入图片描述

当分数变化时，保持相对排名不变，评分也不会变化
（考10分和考60分，能一样吗？！！）
用数学语言描述：
此评分不能充分反映原始数据的全部信息，虽然与成绩数据有一定的相关性，但相关性不是很强。

另一种评分方式：
在这里插入图片描述此种评分方式也不合适：
因为有很多指标不存在理论上的最大值和最小值，如GDP增速
（此例中的卷面成绩100，0也是特殊情况）
因此我们考虑令公式中的最大最小值为参考数据的极值，评分公式如下：

关于此评分公式正确性的三点解释：

比较对象一般远大于两个。（虽然极值处两点评分分别为0，1，数据相关性较低，无法充分反映极值点处的数据，但比较对象较多时，此类情况的误差可忽略不计）
比较的指标往往不只是一个方面的。（多方面评测指标情况下，单一方面极值带来的误差可忽略不计）
有很多指标不存在理论上的最大值和最小值（如GDP增速）

最终得到评分评价标准：
在这里插入图片描述
扩展问题：
增加指标个数

在新问题中，评价指标可分为极大型指标和极小型指标
当我们需要对其进行综合评价时，需要统一标准，即进行指标正向化。
但不同评价指标的量纲不同，不能进行直接进行简单的加和
因此我们需要对指标进行标准化如下：
在这里插入图片描述
标准化处理计算公式：
得到统一标准的指标评分如下：

在这里插入图片描述欧式距离计算得分
带入此问题计算可得：
对评分计算结果进行归一化：

TOPSIS法步骤：

将原始矩阵正向化

在这里插入图片描述极小型——>极大型：
中间型——>极大型：

在这里插入图片描述
区间型——>极大型：

正向化矩阵标准化
计算得分并归一化

在这里插入图片描述

基于熵权法对TOPSIS模型的修正

在这里插入图片描述
之前我们都是利用层次分析法对评价指标的权重进行计算，但这种方法的主观性过强，对结果产生较大影响。因此我们引入一种客观赋权方法。

熵权法：是一种客观赋权方法。
依据原理：指标的变异程度越小，所反映的信息量也越少，其对应的权值也应该越低。（客观=数据本身就可以告诉我们权重）

一个极端例子：对于所有样本而言，这个指标都是相同的数值，那么我们可认为这个指标的权值为0，即这个指标对于我们的评价起不到任何帮助）

对于信息量大小的度量：
越有可能发生的事情，信息量越少，
越不可能发生的事情，信息量就越多。

怎么衡量事情发生的可能性大小？概率

小张和小王是两个高中生。小张学习很差，而小王是全校前几名的尖子生。高考结束后，小张和小王都考上了清华。小王考上了清华，大家都会觉得很正常，里面没什么信息量，因为学习好上清华，天经地义，本来就应该如此的事情。
然鹅，如果是小张考上了清华，这就不一样了，这里面包含的信息量就非常大。怎么说？因为小张学习那么差，怎么会考上清华呢？把不可能的事情变成可能，这里面就有很多信息量。
注：本例子来自微信公众号：“小宇治水 ”

定义概率与信息量的函数关系：
在这里插入图片描述
对于熵权法而言，我们关注的是已有信息，因此信息熵越大，信息量越小。

熵权法的计算步骤：

判断输入的矩阵中是否存在负数，如果有则要重新标准化到非负区间（后面计算概率时需要保证每一个元素为非负数）
计算第j项指标下第i个样本所占的比重，并将其看作相对熵计算中用到的概率
计算每个指标的信息熵，并计算信息效用值，并归一化得到每个指标的熵权

2.2 TOPSIS法代码部分

导入数据（.mat）
load ***.mat

第一步：原始矩阵正向化：

[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) 
Judge = input(['指标是否需要正向化处理，1（需要） ，0（不需要）：  ']);

if Judge == 1
   	loc = input('需要正向化处理的指标(列数)： '); 
    type = input('需要处理的指标类型（1：极小型， 2：中间型， 3：区间型）: ')
    %两个同纬度的行向量
    for i = 1 : size(loc,2)  
    %对这些列分别处理,循环次数：列数
        X(:,loc(i)) = Positivization(X(:,loc(i)),type(i),loc(i));
        % 按输入顺序选择需要正向化处理的某一列向量X(:,loc(i))
        % 使用Positivization函数，对选出的指标评分进行正向化，其参数包括需要处理的（列向量），需要处理的指标类型，列数
        % 返回正向化之后的指标，直接赋值给我们原始数据
    end
    disp('正向化后的矩阵 X =  ')
    disp(X)
end

正向化处理函数：

% function [输出变量] = 函数名称(输入变量）  
% 函数的中间部分都是函数体
% 函数的最后要用end结尾
% 输出变量和输入变量可以有多个，用逗号隔开
% function [a,b,c]=test(d,e,f)
%     a=d+e;
%     b=e+f;
%     c=f+d;
% end
% 自定义的函数要单独放在一个m文件中，不可以直接放在主函数里面（和其他大多数语言不同）

function [posit_x] = Positivization(x,type,i)
% 输入变量有三个：
% x：需要正向化处理的指标对应的原始列向量
% type： 指标的类型（1：极小型， 2：中间型， 3：区间型）
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示：正向化后的列向量
    if type == 1  %极小型
        disp(['第' num2str(i) '列是极小型，正在正向化'] )
        posit_x = Min2Max(x);  %调用Min2Max函数来正向化
        disp(['第' num2str(i) '列极小型正向化处理完成'] )

    elseif type == 2  %中间型
        disp(['第' num2str(i) '列是中间型'] )
        best = input('请输入最佳的那一个值： ');
        posit_x = Mid2Max(x,best);
        disp(['第' num2str(i) '列中间型正向化处理完成'] )

    elseif type == 3  %区间型
        disp(['第' num2str(i) '列是区间型'] )
        a = input('请输入区间的下界： ');
        b = input('请输入区间的上界： '); 
        posit_x = Inter2Max(x,a,b);
        disp(['第' num2str(i) '列区间型正向化处理完成'] )

    else
        disp('没有这种类型的指标，请检查Type向量中是否有除了1、2、3之外的其他值')
    end
end

function [posit_x] = Inter2Max(x,a,b)
    r_x = size(x,1);  % row of x 
    M = max([a-min(x),max(x)-b]);
    posit_x = zeros(r_x,1);   %zeros函数用法: zeros(3)  zeros(3,1)  ones(3)
    % 初始化posit_x全为0  初始化的目的是节省处理时间
    for i = 1: r_x
        if x(i) < a
           posit_x(i) = 1-(a-x(i))/M;
        elseif x(i) > b
           posit_x(i) = 1-(x(i)-b)/M;
        else
           posit_x(i) = 1;
        end
    end
end

function [posit_x] = Mid2Max(x,best)
    M = max(abs(x-best));
    posit_x = 1 - abs(x-best) / M;
end

function [posit_x] = Min2Max(x)
    posit_x = max(x) - x;
     %posit_x = 1 ./ x;    %如果x全部都大于0，也可以这样正向化
end

第二步：对正向化后的矩阵进行标准化：

Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)

第三步：计算得分

%% 计算与最大值的距离和最小值的距离，并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ],2) .^ 0.5;   % D+ 与最大值的距离向量
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ],2) .^ 0.5;   % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N);    % 未归一化的得分
disp('最后的得分为：')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')

% sort(A)若A是向量不管是列还是行向量，默认都是对A进行升序排列。sort(A)是默认的升序，而sort(A,'descend')是降序排序。
% sort(A)若A是矩阵，默认对A的各列进行升序排列
% sort(A,dim)
% dim=1时等效sort(A)
% dim=2时表示对A中的各行元素升序排列
% A = [2,1,3,8]
% Matlab中给一维向量排序是使用sort函数：sort（A），排序是按升序进行的，其中A为待排序的向量；
% 若欲保留排列前的索引，则可用 [sA,index] = sort(A,'descend') ，排序后，sA是排序好的向量，index是向量sA中对A的索引。
% sA  =  8     3     2     1
% index =  4     3     1     2

三、插值算法

当现有数据较少不足以支撑分析的进行时，需要使用一些数学的方法，“模拟产生”一些新的但又比较靠谱的值来满足需求。

一维插值问题

在这里插入图片描述联系计算方法的插值方法：
主要方法：多项式插值和分段插值

插值法原理：证明见计算方法课件
在这里插入图片描述拉格朗日插值

牛顿插值

上面讲的两种插值仅仅要求插值多项式在插值节点处与被插函数有相等的函数值，而这种插值多项式却不能全面反映被插值函数的性态。
然而在许多实际问题中，不仅要求插值函数与被插值函数在所有节点处有相同的函数值，它也需要在一个或全部节点上插值多项式与被插
函数有相同的低阶甚至高阶的导数值。
对于这些情况，拉格朗日插值和牛顿插值都不能满足

埃米尔特插值
在这里插入图片描述

龙格现象（Runge）:
高次插值会产生龙格现象，即在两端处波动极大,产生明显的震荡。在不熟悉曲线运动趋势的前提下，不要轻易使用高次插值。

由于插值多项式次数高精度未必显著提高，反而摄入误差可能会显著增大，为了提高插值精度，我们需要采取分段低次插值。

分段插值
在这里插入图片描述最为常用的两种方法
分段三次埃尔米特插值

三次样条插值

n维插值问题（了解）

在这里插入图片描述

插值方法用于短期预测但不建议

在这里插入图片描述

四、拟合算法

与插值问题不同（插值算法中，得到的多项式f(x)要经过所有样本点。但是如果样本点太多，那么这个多项式次数过高，会造成龙格现象，尽管我们可以选择分段的方法避免这种现象，但分段函数形式复杂）
在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是寻求一个确定的函数（曲线），使得该曲线在某种准则下（只要保证误差足够小）与所有的数据点最为接近，即曲线拟合的最好（最小化损失函数）。

确定拟合曲线

首先根据样本点的分布，确定拟合曲线类型，再进一步求解参数，例如：线性关系
在这里插入图片描述

求解拟合参数

最小二乘法

在这里插入图片描述
arg min( f(x) ):使fx最小的参数取值

在这里插入图片描述
使用matlab求解：

评价拟合函数

SSE越小越好（会受量纲的影响）
——>用拟合优度解决这个问题
在这里插入图片描述

在函数中，参数仅以一次方出现，且不能乘以或除以其他任何参数，不能出现参数的复合函数形式。
matlab曲线拟合工具箱：
curve fitting(导出图片会更高清，还可以生成代码)

SSE(和方差、误差平方和)：The sum of squares due to error
MSE(均方差、方差)：Mean squared error
RMSE(均方根、标准差)：Root mean squared error
R-square(确定系数)：Coefficient of determination
Adjusted R-square：Degree-of-freedom adjusted coefficient of determination

在这里插入图片描述

相关性被提取完毕——>假设性检验：不显著

典型相关分析的思路

在这里插入图片描述

X(Xi列向量),p，q代表组内指标个数
第一组变量代表U,第二组变量代表V
a,b分别是第1，2组变量线性组合的系数矩阵
若一组U,V反映的样本信息不够，需要再找一组，且两组总和变量信息不相关：
cov(U1,U2)=cov(V1,V2)=0

在这里插入图片描述

在方差等于1的前提下，使得代表的相关系数最大，则此代表就是原始数据的第一对典型变量，其系数为第一典型系数，——>再求互不相关的第二对，第三对…这些典型相关变量刻画了原始两组数据之间的线性相关性，后续还需要对相关系数进行显著性检验，不显著的典型相关变量没有意义可以忽略。

系数向量a,b的求法：
在这里插入图片描述

样本典型相关变量及典型相关系数

在这里插入图片描述

写论文时,若用到典型相关分析，应当先给出假设：数据服从正态分布

在这里插入图片描述

典型相关系数的显著性检验

在这里插入图片描述

举例说明

在这里插入图片描述

利用样本数据对协方差矩阵进行估计如下

根据协方差矩阵计算得到A，B矩阵估计值
求出A，B矩阵的非0特征值，开根号得到典型相关系数如下
典型相关变量计算：特征值对应的特征向量即为典型相关变量线性组合中的系数

对典型相关系数进行显著性检验

95%的置信水平下：不存在相关性
得到不期望的结果：调整置信水平，继续检验
90%置信水平下，相关性显著
继续第二典型相关系数检验

基于SPSS的操作：
导入变量
分析
相关
典型相关性
导出:相关描述需要修改：
显著的典型相关系数只有第一个(p值小于0.1，置信水平90%，2，3行p值很大认为不存在显著性，可删去不看)

典型相关分析的拓展

从相关矩阵出发计算典型相关

在这里插入图片描述为了消除量纲的影响，对数据进行标准化

典型载荷分析

在这里插入图片描述

典型冗余分析

在这里插入图片描述

总结：

典型相关分析关键步骤：

假设数据分布有假设：两组数据服从联合正态分布
首先要对两组变量的相关性进行检验（构造似然比统计量）。
p值小于0.05（0.1）表示在95%（90%）的置信水平下拒绝原假设，即认为两组变量有关。

3.确定典型相关变量的个数（直接看典型相关系数对应的P值即可）
利用标准化后的典型相关变量分析问题
进行典型载荷分析
计算前 r个典型变量对样本总方差的贡献

图论最短路

图的基本概念

在线作图：
https://csacademy.com/app/graph_editor/

matlab作图：
在这里插入图片描述权重邻接矩阵

单源最短路

Dijkstra算法

在这里插入图片描述缺点：不能处理负权

Bellman-Ford算法

不支持负权回路

matlab计算最短路径

在这里插入图片描述

多源最短路

Floyd算法

是解决任意两点间的最短路径的一种算法，可以正确处理无向图或有向图（可以有负权重，但不可存在负权回路）的最短路径问题。
算法时间复杂度较高O(n³)
在这里插入图片描述 matlab代码：

还可以编写函数实现：
打印指定两点间最短路径
打印任意两点间最短路径

回归分析

回归分析概念

回归分析的任务就是，通过研究自变量X和因变量Y的相关关系，尝试去解决Y的形成机制，进而达到通过X去预测Y的目的。
(PS:相关性不代表因果性，数据相关不代表其一定存在某种因果关系。绝大多数情况下，我们没有能力去探究严格的因果关系，只好退而求其次，改成通过回归分析，研究相关关系)
(PS:Y即为因变量，在实际应用中，Y常常是我们需要研究那个核心变量)
（PS：X是自变量，也即解释变量）

回归分析分类

常见的回归分析有5类：线性回归，0-1回归，定序回归，计数回归和生存回归，其划分依据是因变量Y的类型。

回归分析任务

回归分析的使命：
使命1：识别重要变量:识别并判断哪些X变量和Y是真的相关，哪些不是。“变量选择”（逐步回归法，X一个一个带入只留下显著的）
使命2：判断相关性的方向：判断有用的X和变量同Y的相关性的正负
使命3：估计权重（回归系数）：确定重要的X变量的前提下，赋予不同的X不同的权重，也就是不同的回归系数，进而确定不同变量之间的相对重要性。

数据的分类

横截面数据：
在某一时点收集的不同对象的数据

例如：
（1）我们自己发放问卷得到的数据
（2）全国各省份2018年GDP的数据
（3）大一新生今年体测的得到的数据

时间序列数据：
对同一对象在不同时间连续观察所取得的数据

例如：
（1）从出生到现在，你的体重的数据（每年生日称一次)。
（2）中国历年来GDP的数据。
（3）在某地方每隔一小时测得的温度数据

面板数据：
横截面数据与时间序列数据综合起来的一种数据资源

例如：
2008‐2018年，我国各省份GDP的数据

在这里插入图片描述

数据的收集

在这里插入图片描述

多元线性回归分析

一元线性回归

在这里插入图片描述数据预处理线性化：

回归系数的解释

在这里插入图片描述

内生性的定义和度量

在这里插入图片描述

无偏性：描述真实值和估计值的偏差，用期望描述
一致性：n趋于无穷时，估计值能够收敛到真实值
内生性：即误差项与自变量的相关性

内生性的蒙特卡洛模拟

在这里插入图片描述

解决内生性的方法

在这里插入图片描述

回归系数的解释

在这里插入图片描述

$\beta$ 0截距项不考虑其意义
重点解释核心解释变量的系数意义及其显著性

在这里插入图片描述

四类模型回归系数的解释

在这里插入图片描述

特殊变量的处理：虚拟变量

在这里插入图片描述

举例进行回归分析

题目描述

在这里插入图片描述

使用软件

SPSS和matlab 在虚拟变量的处理比较麻烦
采用Stata

蒙特卡洛模拟

布丰投针实验引入

定义：

在这里插入图片描述原理：
由⼤数定理可知，当样本容量⾜够⼤时，事件的发⽣频率即为其概率

在这里插入图片描述

应用：

在这里插入图片描述

求解有约束的非线性规划问题

规划问题：
目标函数达fx到最大/最小:eg f(x)=2x1+3x2(x1,x2决策变量)

(gx不等式约束，hx等式约束)
非线性规划只能求近似解（局部最优解，从初始值x0开始）
蒙特卡洛模拟：枚举并带入以求得初始值x0,再通过各种规划算法求解近似值

在这里插入图片描述

01规划问题

在这里插入图片描述

用01矩阵表示某本书是否在某店购买的情况
随机数生成矩阵模拟随机购买情况，计算并更新花费最小值
蒙特卡洛模拟n次

导弹追踪问题

在这里插入图片描述

根据题意将此追踪抽象成数学问题，通过分隔时间片，将连续问题转化为离散问题，再通过蒙特卡洛模拟追踪过程，一步步逼近最终结果

旅行商问题

在这里插入图片描述

当n很大时，用蒙特卡洛模拟会很慢

数学规划模型

概述

在这里插入图片描述

线性规划LP
非线性规划NLP：在初始值周围搜索近似解
整数规划：

线性规划问题求解

在这里插入图片描述
matlab求解步骤

线性规划典型例题

在这里插入图片描述

整数规划

在这里插入图片描述举例用matlab实现：

整数规划的典型例题：

在这里插入图片描述

非线性规划问题

在这里插入图片描述

matlab求解非线性规划

在这里插入图片描述

例题

最大最小化模型

在这里插入图片描述 fminimax函数

多目标规划模型

在这里插入图片描述

分类模型

逻辑回归

在这里插入图片描述

Fisher线性判别分析

在这里插入图片描述

多分类问题

在这里插入图片描述

聚类问题

在这里插入图片描述

K-means聚类算法

在这里插入图片描述
优化算法：

系统（层次）聚类

在这里插入图片描述
例子：
分类原则：把距离近的点聚为一类

在这里插入图片描述以此类推

结果

基于密度的聚类算法dbscan算法

在这里插入图片描述

时间序列分析

在这里插入图片描述
时间序列概念：

时间序列分解：
因为时间序列是某个指标数值长期变化的数值表现，所以时间序列数值变化背后必然蕴含着数值变换的规律性，这些规律就是时间序列分析的切入点。
一般情况下，时间序列的数值变化规律有以下四种：
长期变动趋势
季节变动规律
周期变动规律
不规则变动（随机扰动项）
一个时间序列往往是以上四类变化形式的叠加