个人笔记,如有错误,敬请指正
评分标准
假设的合理性:假设首先是要具有合理性,不能过于离谱;其次是要具有必要性,不能过于废话。
模型的创新性:重点,占评分的一半以上。
结果的正确性:结果不要求绝对正确,但是要求在合理的范围内相对正确。
表述的清晰性:主要体现在论文中。
建模步骤
模型准备:分析题目所给材料信息,判断理应建立何种模型。
模型假设:建立合理的假设,以此完成模型的简化。
模型建立:重点,其核心在于模型的创新性,不能只是单纯的复制套用,毕竟其占据最终评分的一半以上。其创新性可体现为三种类型,分别是:创建新的模型,对现有的模型进行改进,或将多个模型进行结合。
模型求解:列出数据、对数据进行预处理、对模型中的关键参数进行求解,列出结果。
模型分析:又称结果分析。模型分析可以划分成两大部分,分别是表层分析与深层分析,前者是对结果进行表浅性的描述,而后者则是对结果的内在规律进行挖掘。
模型检验:对模型的正确性与合理性进行检验。
模型应用:非必要。说明对模型可能的推广与改进。
数据处理常用算法
在正式建模之前,需要对数据进行预处理,以使其符合建模的需要。
插值拟合:主要用于对数据的补全和基本的趋势分析。
小波分析、聚类分析(高斯混合聚类、K-均值聚类等):主要用于诊断数据异常值并进行剔除。
主成分分析、线性判别分析、局部保留分析等:主要用于多维数据的降维处理、减少数据冗余。
均值、方差分析、协方差分析等统计方法:主要用于数据的截取或者特征选择。
关联与因果常用算法
所谓关联与因果,实际上就是确定数据之间存在的关系,例如某种函数关系。
灰色关联分析方法:适用于样本点较少的情况。
典型相关分析:适用于两组指标之间,或若干组指标与一个指标之间关系的分析。
分类与判别常用算法
对一组对象,按照某种特征进行判别,进而完成分类。
距离聚类(系统聚类):按照几何上的距离进行聚类,例如城市之间的距离。
关联性聚类:按照两者之间存在的关系进行聚类,适用于存在多种指标的聚类。
贝叶斯判别:统计判别方法。
费舍尔判别:适用于训练的样本比较少的情况。
模糊识别:适用于分好类的数据点比较少的情况。
层次聚类、密度聚类、其他聚类:略。
评价与决策常用算法
评价,指基于某种模型体系,对一定对象进行定性或定量的评判;决策则常常是根据评价的结果,按照一定的要求对对象进行选择的过程。
模糊综合评判:是评价一个对象优、良、中、差等的层次性评价,不能进行排序。
主成分分析:评价多个对象的水平并进行排序,指标间关联性很强。
层次分析法:主观性较强,亦比较简单。
数据包络(DEA)分析法:多用于经济方面的评价,并不常用。
秩和比综合评价法:不常用。
神经网络评价:适用于多指标非线性关系的评价。
优劣解距离法(TOPSIS法):主观性较强。
投影寻踪综合评价法:糅合多种算法,例如遗传算法,最优化理论等。
方差分析与协方差分析:适用于比较低级的问题,不甚常用。
预测与预报常用算法
预测相对具体,多是具体的数据;预报相对抽象,多是抽象的性质。这种问题可以分为三类,分别是针对小样本和大样本的内部预测与未来预测,以及大样本的随机因素或周期特征的未来预测。
小样本的内部预测可以用插值拟合来进行解决。
小样本的未来预测算法有:
灰色模型预测(必须掌握):适用于0~50个数据的情况。条件如下:其一,数据样本点个数少,6~15个;其二,数据呈现指数或曲线的形式。
微分方程预测(备用):适用于50~100个数据的情况。条件如下:无法直接找到原始数据之间的关系,但是可以找到原始数据变化速度之间的关系,进而通过公式推导可以转化为原始数据之间的关系。
回归分析预测(必须掌握):适用于100~200个数据的情况。此种算法乃是求一个因变量与若干个自变量之间的关系,条件如下;其一,自变量之间的协方差比较小,最好趋于零,自变量间的关系小;其二;样本点的个数 n > 3k + 1,其中 k 是自变量的个数;其三,因变量要符合正态分布。
大样本的未来预测算法有:
时间序列预测(必须掌握):与马尔可夫预测模型互补的预测方法,其模型例如,ARMA模型、周期模型、季节模型等。
马尔可夫预测(备用):适用于假设马尔可夫性的预测。
小波分析预测、神经网络预测、混沌序列预测:略。
优化与控制常用算法
线性规划、整数规划、0-1规划:适合于比较简单的规划问题。
非线性规划与智能优化算法:适合于比较复杂的优化问题,例如相关的变量或规划较多。
图论、网络优化:适合于多因素交叉的情况,抑或是寻找最优路径的问题。
排队论与计算机仿真:适合于过程性的调度与控制问题。
多目标规划与目标规划、动态规划、模糊规划、灰色规划:略。