- 博客(26)
- 收藏
- 关注
原创 典型相关性分析(清风建模学习笔记)
典型相关分析(CanonicalCorrelationanalysis)研究两组变量(每组变量中都可能有多个指标)之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。 例题:直接对这些变量的相关进行两两分析,很难得到关于这两组变量(观众和业内人士)之间关系的一个清楚的印象。典型相关分析即为把多个变量与多个变量之间的相关化为两个具有代表性的变量之间的相关。选谁做代表?典型相关分析的定义典型相关分析的思路典型相关分析关键...
2021-09-18 12:12:08 17697 3
原创 因子分析模型(清风建模学习笔记)
简介:因子分析可以看成是主成分分析的推广与发展。因子分析法通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,所以,这一分析过程也称为降维。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。(能用主成分分析的均可以用因子分析)因子分析和主成分分析的对比:因子分析的实例(简化列举)原理部分(不重要)(1)模型假设(2)模型性质...
2021-09-16 15:22:14 6807
原创 主成分分析(清风建模学习笔记)
简介:本讲将介绍主成分分析(Principal Component Analysis,PCA),主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。数据降维的作用:主成分分析的思想:例题讲解与操作步骤(注意:分析这一块尤为...
2021-09-15 15:42:52 1296
原创 奇异值分解和图形处理(清风建模学习笔记)
简介:奇异值分解(Singular Value Decomposition)是线性代数中一种重要的矩阵分解,其在图形学、统计学、 推荐系统、信号处理等领域有重要应用。本讲我们将介绍奇异值分解在图形压缩中的运用,并将简单介绍下Matlab对于图形和视频的处理。Matlab运用:代码有可以压缩到指定的特征比例的函数Matlab中图片压缩函数(代码:photo_compress.m)效果:将视频分离为图片(代码:video2photo.m):批量处理...
2021-09-13 10:36:35 449
原创 微分方程模型(清风建模学习视频)
1、基本概念微分方程可用于预测2、怎样建立微分方程专业知识+先有模型(如传染病模型,竞争模型等)3、Matlab求解析解⼩技巧 : " mupad " ⼯具箱或实时脚本可以让计算的结果具有可读性 ; 4、Matlab的数值解函数求解函数一定要化为标准形式(见例题)solver 先采用 ode45 ,如果求解时间过长或求解不满意再换用 ode15s。举例:高阶微分方程:5、微分方程模型(1)人口预测模型(阻滞...
2021-08-31 15:16:36 835
原创 Matlab符号运算(清风建模学习笔记)
一、符号变量的创建和简单运算(1)简单符号创建(2)符号方程的创建(3)符号矩阵(5)简单运算(6)符号表达式的处理①化简②因式分解③ 多项式展开④合并⑤计算分子和分母⑥让结果显示更加自然二、符号函数的求导(diff函数)(1)一元函数求导(2)多元函数求导注意:如果diff函数作用的对象不是符号函数,而是矩阵,那么对应的功能是求差分。三、不定积分与定积...
2021-08-21 22:28:11 349
原创 Matlab画图(清风建模学习笔记)
一、mesh函数:绘制出在某一区间内完整的网格图(1)mesh(X,Y,Z)的用法,其中X、Y和Z都是m*n维的矩阵(2)meshc函数:除了mesh函数图形外,还在xy平面上绘制曲面的等高线(3)meshz函数:除了mesh函数图形外,还在xy平面上绘制曲面的底座二、surf函数:绘制出在某一区间内完整的曲面图(1)surf函数和mesh函数的的调用格式基本相同 两者的区别: mesh绘出彩色的线,surf绘出彩色的面(2)surf...
2021-08-17 22:30:05 1391
原创 预测模型(清风建模学习笔记)
灰色预测模型:灰色预测是对既含有已知信息又含有不确定信息的系统进行预测,就是对在一定范围内变化的、与时间有关的灰色过程进行预测。灰色预测对原始数据进行生成处理来寻找系统变动的规律,并生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况原理介绍:什么时候使用灰色预测?预测题目的小套路灰色预测模型步骤即代码详解BP神经网络预测操作步骤(1)数据的导入(2)使用神经网络进行预测...
2021-08-15 11:47:26 1918
原创 时间序列分析(清风建模学习笔记)
时间序列也称动态序列,是指将某种现象的指标数值按照时间顺序排列而成的数值序列。时间序列分析大致可分成三大部分,分别是描述过去、分析规律和预测未来,本讲将主要介绍时间序列分析中常用的三种模型:季节分解、指数平滑方法和ARIMA模型,并将结合Spss软件对时间序列数据进行建模。时间序列数据:对同一对象在不同时间连续观察所取得的数据。例如: (1)从出生到现在,你的体重的数据(每年生日称一次)。 (2)中国历年来GDP的数据。 (3)在某地方每隔一小时测得的温度数据。间顺序排列
2021-08-12 23:43:38 8541
原创 聚类模型(清风建模学习笔记)
“物以类聚,人以群分”,所谓的聚类,就是将样本划分为由类似的对象组成的多个类的过程。聚类后,我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测;也可以探究不同类之间的相关性和主要差异。聚类和分类的区别:分类是已知类别的,聚类未知K-means算法流程:K‐均值聚类可视化:https://www.naftaliharris.com/blog/visualizing‐k‐means‐clustering/流程图:K-means算法评价:优点: ...
2021-08-10 10:54:42 1618
原创 二分类模型(清风建模学习笔记)
我们将用逻辑回归和Fisher线性判别分析两种分类算法实现二分类模型。水果的例子:对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。 把y看成事件发生的概率,y>0.5表示发生;y<0.5表示不发生逻辑回归步骤(spss):第一步:数据预处理:生成虚拟变量预测成功率逻辑回归系数表表格中新添两列解读y_hat:预测量逐步回归的设置假如自变量有虚拟变量怎么办?预测结果较差怎么办?可在logistic回归模型中...
2021-08-09 12:10:19 13944
原创 数学规划模型(清风建模学习笔记)
(1)什么是数学规划?数学规划是运筹学的一个分支,用来研究:在给定的条件下(约束条件),如何按照某一衡量标准(目标函数)来寻求计划,管理工作的最优方案。(求目标函数在一定约束条件下的极值问题)(2)数学规划的一般形式(3)数学规划的分类(3)线性整数规划Matlab求解线性规划的函数举例:经典例题:代码见:code2.m注意:本题实际上是一个整数规划,我们的件数不应该出现小数。(4)非线性整数规划代码见:code4...
2021-08-08 09:44:15 794 3
原创 蒙特卡洛算法(清风建模学习笔记)
蒙特卡洛方法也称为计算机随机模拟方法。它是基于对大量事件的统计结果来实现一些确定性问题的计算。使用蒙特卡洛的方法必须使用计算机生成相关分布的随机数Matlab给出了生成各种随机数的命令。蒙特卡洛的运用举例:(1)三门问题要点:使奖品随机出现在门的后面,以及计算机随机生成所选的门,通过是否更换选项以及是否正确来判断答案;代码见:code2.m(2)模拟排队问题使用蒙特卡洛随机生成客人到达时间与服务时间,计算平均等待时间。代码见:code3.m(3)非线性规划问题第一步先..
2021-08-03 23:49:41 934
原创 lasso回归操作步骤
lasso回归只起到一个筛选变量得作用,用完之后还得使用原来的线性回归第一步:数据标准化可以借助Matlab的zscore函数,或者直接使用SPSS(分析-描述统计-描述:在描述列表的方框左下角,看到“将标准化得分另存为变量(Z)之后点击打勾,然后确定。)Stata中也有相应的标准化变量的命令,不过一次只能标准化一个变量,例如: egen Y = std(单产) 这个代码就表示将单产标准化,得到的变量记为Y第二步:stata中使用lasso回归何时使用lasso回归?..
2021-08-01 17:26:18 13611 1
原创 多元线性回归分析(清风建模学习笔记)
总体概述:回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决。回归分析的任务就是通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的回归分析:研究X和Y相关性的分析(相关性≠因果性)常见的回归分析有:线性回归、0-1回归、定序回归、计数回归和生存回归,其划分的依据是因变量y的类型。Y的类型:X的含义:回归分析的使命:回归分析的分类:数据的分类:横截面数据:在某一时点收集的不同对象的数据..
2021-07-31 17:01:04 4555
原创 图论最短路径问题(清风建模学习笔记)
图的基本概念:图论中的图(Graph)是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述些事物之间的某种 特定关系,用点代表事物,用连接两点的线表示相应两个事 物间具有这种关系。 一个图可以用数学语言描述为G(V(G),E(G))。V(vertex)指 的是图的顶点集,E(edge)指的是图的边集。 根据边是否有方向,可将图分为有向图和无向图。 另外,有些图的边上还可能有权值,这样的图称为有权图。在线作图:①https://csacademy.com/app/graph_edi
2021-07-27 20:37:45 667
原创 正太分布均值假设性检验(清风建模学习笔记)
假设检验的步骤可以归纳如下:(1)写出原假设和备择假设;(2)在原假设成立的条件下,构造一个统计量,该统计量服从某一分布;(3)用已知的样本数据带入统计量的公式,得到一个检验值;(4)给定置信水平来得到一个接受域的区间,看检验值是否落在接受域中,或者用检验值和区间的临界值进行比较,来判断是否接受原假设(或者计算该检验值对应于其分布的p值,并将p值和指定的显著性水平比较从而来确定是否接受原假设)。(查表)统计量公式:一个正态分布数据检验:Z检验举例(知道标准差使用.
2021-07-25 18:35:43 276
原创 相关性分析(清风建模学习笔记)
本讲我们将介绍两种最为常用的相关系数:皮尔逊 pearson相关系数和斯皮尔曼spearman等级相关系数。 它们可用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错的方法)。皮尔逊相关系数:总体皮尔逊相关系数:样本皮尔逊相关系数:注意:总体皮尔逊相关系数除以n,样本皮尔逊相关系数除以n-1运用皮尔逊相关系数的条件:关于皮尔逊相关系数的一些误区:这里的相关系数只是用来衡量两个变量线性相关...
2021-07-24 23:17:06 29635 1
原创 拟合(清风建模学习笔记)
与插值问题不同,在拟合问题中不需要曲线一定经过给定的点。拟合问题的目标是寻求一个函数(曲线),使得该曲线在某种准则下与所有的数据点最为接近,即曲线拟合的最好(最小化损失函数)。插值和拟合的区别:插值算法中,得到的函数需要经过全部样本点。但是由于样本多造成多项式次数过高会容易造成龙格现象。而拟合算法不需要经过全部样本点,只需保证误差足够小即可,得到一条较为简单的曲线,这就是拟合的思想。最小二乘法确定拟合曲线:求解可得评价拟合的好坏拟合优度:R²一定要注意R...
2021-07-21 11:21:18 530
原创 插值算法(清风建模学习笔记)
作用:当数模比赛中,数据较少时,不足以支撑分析的进行,这时候就需要一些数学方法,“模拟产生”一些新的但又比较靠谱的值来满足需求,这就是插值的作用。插值法的分类:
2021-07-19 09:37:25 828
原创 用excel绘制统计图表(清风建模学习笔记)
统计图最常用的就几种:饼图、柱状图、条形图、直方图、折线 图 、散点图、箱线图等。对于同一组数据,不同的同学绘制出来的效果可能 截然不同,好的图形能够让读者一样就能看出数据的规律和特点,其传递给读 者的信息是准确和有效的,准确是指我们不能随意绘制图形,因为每个统计图 适用的数据是有限制的;有效是指图形传递出来的信息和你得到的结论是吻合 的;这是一个图形要满足的最基本两点。饼图最适合采用饼图的情形: 1. 只有一个数据类型(单分类数据)。(如销售量)2. 任何数据值都
2021-07-18 17:26:38 3062
原创 模糊综合评价(清风建模学习笔记)
模糊数学又称Fuzzy 数学,是研究和处理模糊性现象的一种数学理论和方法。生活中处处存在模糊性。性别,天气,年龄等属于确定性概念,而帅,高,白,年轻等均为模糊性概念。1.模糊集合和隶属函数(a)模糊集合:用来描述模糊性概念的集合(帅,高,白,年轻)(b)与经典集合相比,模糊集合承认亦此亦彼。(不确定性)a∈A,但a不属于A也可能存在(c)对模糊集合,用隶属函数对模糊集合刻画A:模糊集合(d)模糊集合三种表示方法一般采用扎德表示法举例:特别的,当论域(类..
2021-07-16 19:06:40 6576 1
原创 灰色关联分析(清风建模学习笔记)
概述:对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。适用题型:(1)系统分析; (2) 综合评价;一、系统分析在一般的抽象系统中,一般包含多种因素,多种因素共同作用的结果决定了该系统的发展趋势。...
2021-07-13 20:51:28 6591
原创 TOPSIS(优劣解距离法)清风建模学习笔记
简介TOPSIS (Technique for Order Preference by Similarity to an Ideal Solution )法是C.L.Hwang和K.Yoon于1981年首次提出,TOPSIS法根据有限个评价对象与理想化目标的接近程度进行排序的方法,是在现有的对象中进行相对优劣的评价。TOPSIS法是一种逼近于理想解的排序法,该方法只要求各效用函数具有单调递增(或递减)性就行。TOPSIS法是多目标决策分析中一种常用的有效方法,又称为优劣解距离法。层次分析法的局限性
2021-07-11 15:18:13 3052
原创 层次分析法(AHP)的初步理解(清风建模学习笔记)
层次分析法简介及适用题型:是建模比赛中最基础的模型之一,其主要用于解决评价类问题(例如:哪种方法最好,哪位运动员参赛,哪位员工表现优秀);一.模型介绍一般分为三层,最上面为目标层,最下面为方案层,中间是准则层或指标层。此图需要放入论文中。层次分析法可用打分去解决,根据权重的表格计算得分。而我们只需要补充完成下面表格即可:同颜色的单元格的和为一,它们表示针对某一因素所占的权重(得分);二.基本步骤(采用选取旅游景点例题)①解决评价类问题,首先想到三个问题...
2021-07-06 16:00:07 5364
原创 粒子群算法的简单认识与应用
初步认识:粒子群算法为智能优化算法的一种,其全称为粒子群优化算法,源于对鸟群捕食的行为研究 。 该算法最初是受到飞鸟集群活动的规律性启发,利用群体中的个体对信息的共享使整个群体的运动再问题求解空间中从无序到有序的演化过程,从而求得一个可行解。原理:用一种粒子来模拟上述的鸟类个体,每个粒子可视为N维搜索空间中的一个搜索个体,粒子的当前位置即为对应优化问题的一个候选解,粒子的飞行过程即为该个体的搜索过程.粒子的飞行速度可根据粒子历史最优位置和种群历史最优位置进行动态调整.粒子仅具有两个属性:速度和位置,速度
2021-06-25 16:53:42 2115
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人