数学建模
文章平均质量分 61
数学建模模型
路Louis
这个作者很懒,什么都没留下…
展开
-
BP神经网络
BP神经网络的过程主要分为两个阶段,第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误差的反向传播,从输出层到隐含层,最后到输入层,依次调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置。bp神经网络的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络是一种多层的前馈神经网络,其主要的特点是信号是前向传播的,而误差是反向传播的。自变量X为1个或1个以上的定类或定量变量,因变量Y为一个定量变量。......原创 2022-07-30 18:54:54 · 1486 阅读 · 0 评论 -
权重分析——CRITIC权重法
指标之间的冲突性,用相关系数进行表示,若两个指标之间具有较强的正相关,说明其冲突性越小,权重会越低。使用相关系数来表示指标间的相关性,与其他指标的相关性越强,则该指标就与其他指标的冲突性越小,反映出相同的信息越多,所能体现的评价内容就越有重复之处,一定程度上也就削弱了该指标的评价强度,应该减少对该指标分配的权重。在CRITIC法中使用标准差来表示各指标的内取值的差异波动情况,标准差越大表示该指标的数值差异越大,越能放映出更多的信息,该指标本身的评价强度也就越强,应该给该指标分配更多的权重。...原创 2022-07-23 18:59:30 · 20695 阅读 · 4 评论 -
权重分析——熵权法
权重分析是通过熵权法对问卷调查的指标的重要性进行权重输出,根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。信息量越小,不确定性越大,熵也越大。根据信息熵的定义,对于某项指标可用熵值来判断某个指标的离散程度,其熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)也越大。比如对拥有的6个科室的8项考核指标进行权重分析,得到各个考核指标的权重占比。...原创 2022-07-23 18:05:22 · 9789 阅读 · 0 评论 -
回归——岭回归
岭回归主要解决的问题是两种一是当预测变量的数量超过观测变量的数量的时候(预测变量相当于特征,观测变量相当于标签),二是数据集之间具有多重共线性,即预测变量之间具有相关性。岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。自变量X至少一项或以上的定量变量或二分类定类变量,因变量Y要求为定量变量(若为定类变量,请使用逻辑回归)。...原创 2022-07-29 18:02:41 · 5056 阅读 · 0 评论 -
回归——分层回归
分层回归(层次回归)本质上是建立在回归分析基础上,区别在于分层回归可分为多层,用于研究两个或者多个回归模型之间的差异。分层回归将核心研究的变量放在最后一步进入模型,以考察在排除了其他变量的贡献的情况下,该变量对回归方程的贡献。我们可以根据两个模型所解释的变异量的差异来比较所建立的两个模型。分层回归相对来说建模更具备专业意义的指导,通常将专业认为重要的变量放在最后一层,以确定在控制其他变量之后,该自变量的意义大小。上一个层次与下一个层次的拟合变化情况,用于分析多加入的变量对自变量(Y)的影响程度。...原创 2022-07-29 17:43:46 · 13282 阅读 · 0 评论 -
回归——逻辑回归
逻辑回归是研究二分类因变量观与一些影响因素之间关系的一种多变量分析方法。但如果因变量是多个类别的,则要用到多分类逻辑回归去研究因变量与一些影响因素之间的关系。输入:因变量 Y 为分类变量,自变量 X 为至少一项定量变量或定类变量。输出:逻辑回归系数估计以及分类预测的效果评价。根据年龄、月收入、性别、家庭人口等影响因素(自变量)来研究工薪群体的上下班交通工具是公交地铁、自行车、还是私家车(因变量)......原创 2022-07-18 17:23:54 · 1123 阅读 · 0 评论 -
回归——线性回归
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。输入:自变量 X 至少一项或以上的定量变量或二分类定类变量,因变量 Y 要求为定量变量。输出:模型检验优度的结果,自变量对因变量的线性关系等等。通过自变量(房子年龄、是否有电梯、楼层高度、房间平方)原创 2022-07-13 17:00:30 · 1616 阅读 · 0 评论 -
分类——K-Means聚类分析
聚类分析是一种基于中心的聚类算法(K 均值聚类),通过迭代,将样本分到 K 个类中,使得每个样本与其所属类的中心或均值的距离之和最小。与分层聚类等按照字段进行聚类的算法不同的是,快速聚类分析是按照样本进行聚类。输入:1 个或一个以上的定类变量(独热编码非必选)或者定量变量,预先设定类别个数。输出:根据预先设定的类别个数,划分为其设定的类别。根据调研用户的收入、年龄、学历等变量进行聚类,分为高质量人类,精英人士与普通人3个类别。K-Means 算法是一种无监督学习,同时也是基于划分的聚类算法,一般用欧式距离原创 2022-07-13 16:03:58 · 5216 阅读 · 0 评论 -
预测——时间序列分析
ARIMA 模型的全称叫做自回归移动平均模型,是统计模型中最常见的一种用来进行时间序列预测的模型。输入:特征序列为1个时间序列数据定量变量输出:未来N天的预测值模型基于如下的观念:要预测的时间序列是由某个随机过程生成的.如果生成序列的随机过程不随时间变化,则该随机过程的结构可以被确切地刻画和描述。利用序列过去的观察值,可以外推出序列的未来值。在 ARIMA 模型中,序列的未来值被表示成滞后项和随机干扰项的当期及滞后期的线性函数,即模型的一般形式如下式所示:ARIMA 模型的建模过程可以分为以下四个步骤:原创 2022-07-11 21:31:54 · 902 阅读 · 0 评论 -
预测——马尔可夫链
马尔可夫是俄国著名的数学家。马尔可夫预测法是以马尔可夫马尔可夫马尔可夫的名字命名的一种特殊的市场预测方法。马尔可夫预测法主要用于市场预测和销售期望利润的预测。它是基于马尔可夫链,根据事件的目前状况预测其将来各个时刻(或时期)变动状况的一种预测方法。马尔可夫预测法是对地理、天气、市场、进行预测的基本方法,它是地理预测中常用的重要方法之一。输入:1个时间序列数据定量变量输出:马尔可夫预测的预测结果基于 1985-2021 年某杂志的销售量,预测某商品的未来五年的销售量。事物的发展状态总是随着时间的推移而不断原创 2022-07-10 23:01:33 · 5373 阅读 · 0 评论 -
预测——灰色预测
灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。输入:1个时间序列数据定量变量输出:灰色预测的拟合预测结果基于2000-2021年某产品的年销售量,使用灰色预测模型对未来年销售量进行预测。1.在建立灰色预测模型之前必须要保障建模方法的可行性,即需要对已知的原始数据进行级比检验 设初始非负数据序列为:只有当原创 2022-07-07 09:57:30 · 3313 阅读 · 4 评论 -
预处理——异常值检测
数据需要服从正态分布,正负3∂的概率是99.7%,那么距离平均值3∂之外的值出现的概率为P(|x-u|3∂)=0.003,属于极个别的小概率事件。四分位距(IQR)就是上四分位与下四分位的差值。而我们通过IQR的1.5倍为标准,规定超过(上四分位+1.5倍IQR距离,或者下四分位-1.5倍IQR距离)的点为异常值。可检测与处理变量数据中包含的异常值,异常值检测逻辑是对变量的数据集(类似于列)按照设置的阈值进行判定,筛选出落在异常值检测范围内的数据,再根据处置方法将原数据替换。去除异常值后的数据列。...原创 2022-07-20 22:20:10 · 2239 阅读 · 0 评论 -
预处理——插值
若函数f(x)在自变数x一些离散值所对应的函数值为已知,则可以作一个适当的特定函数p(x),使得p(x)在这些离散值所取的函数值,就是f(x)的已知值。从而可以用p(x)来估计f(x)在这些离散值之间的自变数所对应的函数值,这种方法称为插值法。输入:存在缺失值的原始数据输出:补充缺失值后的数据x,y为原始一维数据,xi为插值点,method为‘nearest’邻近点插值;‘linear’线性插值;‘spline’三次样条插值;‘pchip’立方插值。x,y为原始一维坐标数据,z为原始高度矩阵,xi,yi为原创 2022-07-06 15:12:29 · 319 阅读 · 0 评论 -
数据降维——因子分析
因子分析是基于降维的思想,在尽可能不损失或者少损失原始数据信息的情况下,将错综复杂的众多变量聚合成少数几个独立的公共因子,这几个公共因子可以反映原来众多变量的主要信息,在减少变量个数的同时,又反映了变量之间的内在联系。通常因子分析有三种作用:一是用于因子降维,二是计算因子权重,三是计算加权计算因子汇总综合得分。输入:2 个或两个以上的定量变量(假设为 N 个变量)。输出:最低可降维成 1 维(一个变量,一般用于综合评价),最多可降维成 N 个变量(一般用于数据脱敏),同时可以获取降维后各个变量的组成权重,原创 2022-07-02 13:15:45 · 4736 阅读 · 0 评论 -
数据降维——主成分分析
主成分分析将多个有一定相关性的指标进行线性组合,以最少的维度解释原数据中尽可能多的信息为目标进行降维,降维后的各变量间彼此线性无关,最终确定的新变量是原始变量的线性组合,且越往后主成分在方差中的比重也小,综合原信息的能力越弱,与因子分析不同的是,因子分析是利用少数几个公共因子去解释较多个要观测变量中存在的关系,它不是对原始变量的重新组合。输入:2 个或两个以上的定量变量(假设为 N 个变量)输出:最低可降维成 1 维(一个变量,一般用于综合评价),最多可降维成 N 个变量(一般用于数据脱敏),同时可以获取原创 2022-07-02 13:05:25 · 1527 阅读 · 0 评论 -
关联性——组内相关系数
组内相关系数(ICC)是衡量和评价观察者间信度和复测信度的信度系数指标。通常可以用于问卷调查中评价一个对象对多个样本在一段时间的重测信度,或者判断一批对象对多个样本的一致性检验。输入:至少两项或以上的定量变量或有序的定类变量,一般要求数据为量表数据输出:设计的问卷量表题目里各样本是否具有一致性5个评委对于同一批选手进行评分,测量其评分是否一致。或者测量复测信度,比如多次收集某个评委对100个参赛选手的评分(或同一批评委的评分平均值),测量其每次评分的相关度是否一致。最先提出的 ICC 是改造的 Pears原创 2022-07-01 22:35:00 · 5057 阅读 · 0 评论 -
关联性——典型相关分析
典型相关分析是研究多个变量和多个变量之间的线性相关关系,能够揭示出两组变量之间的内在联系。首先在每组变量中找到变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的那一组。如此继续配对,直到两组变量之间的相关性被提取完。输入:集合 Y 为至少两项或以上的定量变量或有序定类变量,集合 Y 为至少两项或以上的定量变量或有序定类变量。输出:成对典型变量的相关性,以及典型变量对研究变量的解释比例。研究200名大学生四个学术得分变量原创 2022-06-29 18:12:17 · 2006 阅读 · 0 评论 -
关联性——相关性分析
相关分析是对变量两两之间的相关程度进行分析。相关分析的计算方式有三种,分别是 Pearson 相关系数(适用于定量数据,且数据满足正态分布)、Spearman 相关系数(数据不满足正态分布时或者定序数据使用)。Kendall's tau -b 相关系数(定序变量)输入:两个或者两个以上的定量变量或定序变量输出:两两变量之间是否呈现显著性相似以及相似的程度人的身高和体重之间;空气中的相对湿度与降雨量之间的相关关系都是相关分析研究的问题1.定类变量:只能区分为某一类别,类别平等2.定序变量:只能区分为某一类原创 2022-06-28 15:55:40 · 8812 阅读 · 0 评论 -
关联性——灰色关联分析
对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。输入:特征序列为至少两项或以上的定量变量,母序列(关联对象)为 1 项定量变量。输出:反应考核指标与母序列的关联程度。分析近10年内,影院数原创 2022-06-27 21:29:03 · 9035 阅读 · 0 评论 -
评价——秩和比综合评价
秩和比(RSR)指将效益型指标从小到大排序进行排名、成本型指标从大到小排序进行排名,再计算秩和比,最后统计回归、分档排序。通过秩转换,获得无量纲统计量 RSR,以 RSR 值对评价对象的优劣直接排序或分档排序,从而对评价对象做出综合评价。输入:至少两项或以上的定量变量。输出:反应考核指标在量化评价中的综合得分与分档 基于某省6个地级市的科技投入 ,科技产出,总体科技进步三个指标进行综合评价。1.构造矩阵:假设评价对象为 n 个, 评价指标为 m 个, 构建数据矩阵 (n ×m)。2.编秩矩阵:(1)原创 2022-06-27 15:26:16 · 1019 阅读 · 0 评论 -
评价——TOPSIS
TOPSIS 法是一种常用的组内综合评价方法,能充分利用原始数据的信息,其结果能精确地反映各评价方案之间的差距。基本过程为基于归一化后的原始数据矩阵,采用余弦法找出有限方案中的最优方案和最劣方案,然后分别计算各评价对象与最优方案和最劣方案间的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。该方法对数据分布及样本含量没有严格限制,数据计算简单易行。输入:至少两项或以上的定量变量。输出:反应考核指标在量化评价中的综合得分。为了客观地评价我国研究生教育的实际状况和各研究生院的教学质量,国务原创 2022-06-26 14:03:07 · 482 阅读 · 0 评论 -
评价——模糊综合评价
模糊综合评价借助模糊数学的一些概念,对实际的综合评价问题提供评价,即模糊综合评价以模糊数学为基础,应用模糊关系合成原理,将一些边界不清、不易定量的因素定量化,进而进行综合性评价的一种方法。输入:至少两项或以上的定量变量。输出:反应考核指标在量化评价中的综合得分。某饮食行业品牌发布一款新零食,欲了解消费者对该种零食的接受程度。一共有五个评价指标(分别是价格、味道、包装、营养、性价比),以及评语共有四项(分别是很欢 迎,欢迎,一般,不欢迎)1.确定评价对象的因素论域,也就是有 m 个指标,表面我们对被评价对象原创 2022-06-26 11:31:03 · 607 阅读 · 1 评论 -
评价——层次分析
层次分析法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标之间能否实现的标准之间的相对重要程度,例如通过构建评价指标(景色、费用,居住,饮食、旅途)对候选旅游地(桂林、黄山,北戴河)量化评价,进行选择。输入:根据提示进行指标或者方案两两对比。输出:各方案的量化得分或者同一级的指标权重。案例:通过构建评价指标(景色、费用,居住,饮食、旅途)对候选旅游地(桂林、黄山,北戴河)量化评价,进行选择。1 建立多级递阶的结构模型按支配关系自原创 2022-06-25 22:10:40 · 1167 阅读 · 0 评论 -
优化——遗传算法
本文将采用二进制编码的方式,将十进制的变量转换成二进制,用0和1组成的数字串模拟染色体,可以很方便地实现基因交叉、变异等操作。这是整个遗传算法的最后一步,经过若干次的进化过程,种群中适应度最高的个体代表问题的最优解,但这个最优解还是一个由0和1组成的数字串,要将它转换成十进制才能供我们理解和使用。适应度函数(Fitness Function)的选取直接影响到遗传算法的收敛速度以及能否找到最优解,因为在进化搜索中基本不利用外部信息,仅以适应度函数为依据,利用种群每个个体的适应程度来指导搜索。...原创 2022-08-05 20:40:29 · 768 阅读 · 0 评论 -
优化——多目标规划
规划求解是研究约束条件下目标函数的极值问题的数学理论和方法。输入:目标函数,约束条件和决策变量取值范围。输出:规划求解结果,以及规划求解方程导出。正偏差变量 :实际值超过目标值的量,大于等于0负偏差变量 :实际值少于目标值的量,大于等于0绝对约束:必须满足的条件目标约束:尽量满足的条件,加上负偏差变量减去正偏差变量后成为等式优先因子:主观上为每个目标赋予的权重两种产品,产品1 每个耗材为1,耗时为2天,利润为8万;产品2每个耗材为2,耗时为1天,利润为10万。总材料量为10。要求11天内必须完成。确定各自原创 2022-06-24 14:27:47 · 1156 阅读 · 0 评论 -
优化——线性、非线性、整数规划
规划求解是研究约束条件下目标函数的极值问题的数学理论和方法。输入:目标函数,约束条件和决策变量取值范围。输出:规划求解结果,以及规划求解方程导出。某工厂生产甲、乙两种产品,每个产品的利润分别是 4000 和 3000 元。生产甲产品需要用 A、B 机器加工,加工时间分布为每台 2 小时和 1 小时。生产乙产品需要用 A、B、C 三种机器加工。加工时间为每台各一小时。若每天可以用于加工的机器时数为 A 是 10 小时,B 是 8 小时,C 是 7 小时。问该厂应生产甲、乙产品各几个,才能使总利润最大。可原创 2022-06-22 16:59:04 · 283 阅读 · 0 评论