自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(412)
  • 收藏
  • 关注

原创 深度解析 | 二元Logistic回归模型(单因素筛查、软件操作及结果解读)

划重点二元Logistic回归分析因变量为二分类变量,自变量可以为定量数据或者定类数据,定类数据时需要进行哑变量处理再分析。当自变量较多时,先通过单因素分析筛选自变量,然后仅保留有显著影响的自变量进行多因素Logistic回归。同时为避免遗漏重要变量,差异的显著性水平可以适当放宽。进行回归分析时,针对定类变量生成的哑变量,需要留一项作为参照项,一般为最低水平。解读的时候需要注意二者的关系,定量变量与定类变量解读方式略有不同。

2024-09-10 17:56:22 1244

原创 2024数学建模国赛选题建议+经典模型汇总+论文模板

通过分析5个题目的特点,可知数学建模常用的模型大概可以分为五大类——

2024-09-05 14:22:55 1589

原创 空间计量 | 似不相关回归SUR

通常情况下,研究X对于Y的影响时,Y只能为一个,如果有多个则重复进行多次,即每次都只考虑单一方程估计,如果有多个Y时,将多个Y同时进行联合估计有可能会提高估计效率,即模型的拟合能力更加接近于实际数据。如果有多个Y需要同时估计,当前有两种处理方式,第一种是使用联立方程组进行估计,第二种方式则是使用似不相关回归(seemingly unrelated regression estimation,sur)进行估计。

2024-08-30 14:29:42 960

原创 空间计量 | 空间面板模型

空间计量研究中,如果为截面数据,可使用比如空间滞后模型、空间误差模型、空间杜宾模型等。当为面板数据时则稍有不同,面板数据进行空间计量分析时,主要有三个注意点,1是数据格式的整理,包括空间权重矩阵的数据格式和面板数据的数据格式(此处需要为平衡面板数据),以及空间权重矩阵与面板数据的ID匹配;2是面板模型的选择,是固定效应还是随机效应,应该使用Hausman检验进行检验并且得出结论;3是空间计量模型的选择,应该是面板滞后模型还是面板误差模型,此处默认提供LM检验得出结果。

2024-08-30 14:27:12 1196

原创 空间计量 | 空间权重矩阵构造

空间权重矩阵可用于标识空间点与点之间的关系,比如中国有31个省,那么31个省两两之间的物理实际距离情况,31个省两两之间的经济距离情况,31个省两两之间是否具有相邻关系等,多数情况下空间权重矩阵里面的关系为‘是否相邻’,以及具体如何以实际研究为准即可。比如上图中的空间权重矩阵,其表示中国31个省市之间空间关系,此关系为两两省份之间是否具有相邻性,数字1表示具有相邻关系数字0表示没有。切记:空间权重矩阵为n*n阶矩阵结构,里面第1行为空间点(比如省)的名称,第1列是空间权重数据,而不能是空间点名称。

2024-08-30 11:45:49 432

原创 空间计量 | 空间杜宾误差模型SDEM

空间计量研究中,空间杜宾误差模型,其考虑两项,分别是自变量X的空间滞后作用,以及误差扰动项的空间滞后作用,其数学模型公式如下:yβk* x +θk* Wx +uuλ* Wu +µ(其中βk表示X的回归系数,Wx表示自变量X空间滞后变量,θk表示Wx的回归系数,Wu表示u的空间滞后变量,λ表示Wu的回归系数,u和µ为扰动误差项)

2024-08-30 11:43:46 849

原创 空间计量 | 空间杜宾模型SDM

空间计量研究中,空间杜宾是一种较为常用的模型,其考虑两个空间性,分别是自变量的空间滞后作用,以及因变量的空间滞后作用,其数学模型公式如下:yβk* x +θkµ(其中βk表示X的回归系数,Wx表示自变量X空间滞后变量,θk表示Wx的回归系数,Wy表示因变量Y空间滞后变量,ρ表示Wy的回归系数,µ为扰动项)

2024-08-30 11:42:22 762

原创 空间计量 | 空间滞后误差SAC模型

空间计量中,空间滞后SLM模型其考虑因变量空间滞后变量,空间误差SEM模型其考虑误差项空间滞后性。如果二者同时考虑,即考虑因变量空间滞后变量,并且考虑误差项空间滞后项,那么可使用空间滞后误差模型,其也称作一般空间模型或者空间交叉模型(SAC模型),其数学公式如下:yβk* x +ρ* Wy +uuλ* Wu +µ(其中βk表示X的回归系数,Wy表示因变量空间滞后变量,ρ表示Wy的回归系数,Wu表示u的空间滞后变量,λ表示Wu的回归系数,u和µ为扰动误差项)

2024-08-30 11:40:01 954

原创 空间计量 | 空间误差模型SEM

在空间OLS回归分析中如果得到LM检验并且判断得到应该使用空间误差SEM模型时,接着本文档介绍空间误差SEM模型。首先空间误差SEM模型的数学模式公式如下:yβk* x +uuλ* Wu +µµ为扰动项),Wu为误差(扰动项)空间滞后变量,λ为其回归系数值空间误差模型时,其将误差项纳入模型中,其实质是将误差项自相关纳入考虑中(空间滞后模型是将因变量空间滞后变量纳入模型)。

2024-08-30 11:27:50 961

原创 空间计量 | 空间滞后模型SLM

在空间OLS回归分析中得到LM检验并且判断得到应该使用空间滞后SLM模型(也称空间自回归SAR模型)时,接着本文档介绍空间滞后SLM模型。首先空间滞后SLM模型的数学模式公式如下:yβk* x +ρ* Wy +µµ为扰动项),Wy为因变量空间滞后变量。

2024-08-30 11:25:33 728

原创 空间计量 | 空间OLS回归

基于LM-error和LM-lag均显著时,则需要结合Robust LM-error和Robust LM-lag检验进一步判断,如果Robust LM-error和Robust LM-lag检验均不显著,此时退回到上一步即对比LM-error和Lm-lag这两个检验对应的卡方值,哪个更大则使用更大对应的模型,比如LM-error检验的卡方值更大则使用空间误差模型,如果LM-lag检验的卡方值更大则使用空间滞后模型;当然里面的数字也可以为小数,小数时很可能就是表示两两间的比如物理距离或者经济距离等。

2024-08-30 11:23:33 995

原创 SPSS数据分析 | 30+常用分析方法数据格式汇总

如果是进行泰尔指数计算,通常会涉及group项,比如区域(华北、华南、华东、西南、东北)其层次最高,也或者区域的下一层次省份group(北京、天津、河北、上海、浙江等),以及具体最小单位粒度城市,及其对应的GDP/人口信息数据等。比如下图中X有2种情况,Y有3个情况,一种有2*3=6种组合,数据信息只有6种组别的汇总项(即加权项),分别是40,10,20,30,20,50;除原始数据格式外,还有一些分析方法还会使用到加权数据格式,在医学/实验研究中,很多时候只有汇总数据,即带加权项的数据,如卡方检验等。

2024-08-20 15:28:30 1281

原创 假设检验如何确定最小样本量?Power功效分析

计算结果显示,基于I类错误为0.05,两组数据样本量均为100,且两组数据的平均值和标准差值等均确定前提下,最终的功效Power值是0.994,即‘错的说成错的’即‘H0为假并且最终判断成假’这一情况的概率是99.4%,即对‘错的说成错的’这一情况有着很高的把握度。Power功效分析是一种在实验研究设计阶段,基于预设的显著性水平α(通常为0.05)、期望的效应量和所需统计功效(1-β),计算适当样本量的统计方法,同时,它也可用于评估给定样本量的统计功效。在科学研究中,假设检验是一个至关重要的统计工具。

2024-08-13 17:25:05 1358

原创 Power功效分析之广义模型原理及案例实操

Power功效分析常用于实验研究时样本量的计算(或功效值计算),如果是涉及广义模型时的回归系数差异计算时,SPSSAU共提供二元logit回归和Poisson回归情况时的Power功效分析,具体如下表格所述:比如二元Logit回归时,对比某个自变量X回归系数的差异情况,此时则使用‘二元Logit回归’,当然如果研究时使用的是Poisson回归,也是对比某X回归系数的差异情况,此时使用‘Poisson回归’。

2024-08-06 11:08:11 476

原创 Power功效分析之相关性原理及案例实操

Power功效分析常用于实验研究时样本量的计算(或功效值计算),如果是涉及相关系数计算时,SPSSAU共提供两种情况时的Power功效分析,具体如下表格所述:比如研究某1个相关系数与预期(或已知)的相关系数差异,那么使用‘单系数相关’,如果是研究两个相关系数的差异,那么可使用‘两个系数相关’。SPSSAU进行功效分析时,共包括两项功能,分别是计算样本量和计算功效Power值,具体涉及到Power功效原理,可查阅‘Power原理’内容。

2024-08-06 11:06:56 421

原创 Power功效分析之率差原理及案例实操

Power功效分析常用于实验研究时样本量的计算(或功效值计算),比如在医学研究中率差计算时功效分析,关于率差计算时的几种类型,具体如下表格所述:比如研究患病率与文献已有数据的差异时则使用‘总体率’,也或者仅仅是对比两个率的差异时则使用‘两个率’,如果有多个比率值,希望查看该多个比率是否存在差异则使用‘卡方拟合优度’,如果研究比如X和Y的差异即使用卡方检验时,则使用‘多样本率’。

2024-08-06 11:05:35 348

原创 Power功效分析之方差原理及案例教程

Power功效分析常用于实验研究时样本量的计算(或功效值计算),实验研究中进行方差分析的情况较多,在SPSSAU中单独将方差放成一个计算Power的方法,其具体包括单因素方差/双因素方差和多因素方差,具体如下表格所述:无论是单因素/双因素或者三因素方差,均可加入协变量个数这一参数信息,默认没有协变量即为0个协变量。

2024-08-06 11:03:51 294

原创 Power功效分析之均值差原理及案例实操分析

接着以独立样本t检验为例进行说明,其研究两组数据的均值差异,比如实验组和对照组的均值差异,那么预期(或者以往实验/以往文献)有着两组数据的平均值和标准差数据,并且基于预定好的alpha值和power值,此时样本量应该多少适合呢?也或者有着两组数据的平均值和标准差数据,基于设定好的alpha值和样本量,此时power水平如何呢?即在SPSSAU中,共包括两项功能,分别是计算样本量和计算功效Power值,具体涉及到Power功效原理,可查阅‘Power原理’内容。

2024-08-01 16:14:57 580

原创 Power功效分析原理及案例实操分析

Power功效分析是一种实验研究时,基于某显著性水平前提下所需样本量和统计功效的方法。Power功效分析通常应用于医学、心理和相关生物学研究,其目的是计算适合的样本量和统计功效。ppPower功效分析的核心是研究Power,但其需要基于确定性的alpha值(I型错误)前提下,因为I型错误和II型错误有着联系,二者是‘此消彼长’的关系,I型错误大那么II型错误小,I型错误小那么II型错误大。

2024-08-01 16:11:17 828

原创 SPSSAU | Power功效分析之线性回归

比如R方值的变化的功效能力时(也或者R方变化值的功效能力时),此时可使用R方值。如果是研究回归系数的差异性(包括标准化回归系数和非标准化回归系数两种情况)时,可使用‘回归系数差异’,如果研究中介作用时的功效能力情况,可使用‘中介作用’。SPSSAU进行功效分析时,共包括两项功能,分别是计算样本量和计算功效Power值,具体涉及到Power功效原理,可查阅‘Power原理’内容。

2024-08-01 16:08:18 484

原创 SPSSAU | 德尔菲专家法原理及案例实操分析

德尔菲专家法Delphi是一种结构化的预测和决策方法,主要用于收集和综合专家意见,进而做出相应决策的研究方法。比如在我们建立指标体系时,首先选择20个备选指标,然后寻找10位专家进行评价(评价该20个指标是否具有可行),那么此时就可使用Delphi专家法进行研究。Delphi法广泛用于各个行业,涉及专家打分数据均可对其进行分析,分析上首先保证专家打分数据的一致性,在此前提下时进一步分析各具体指标的各类指标,最终得出判断和决策。1。

2024-08-01 14:09:05 922

原创 SPSSAU | CatBoost模型原理及案例实操分析

CatBoost 是一种基于梯度提升的决策树(Gradient Boosting Decision Trees, GBDT)算法,专门优化了处理分类特征和序列数据的能力。算法步骤如下:第一:生成初始模型,从简单的模型开始,通常是所有目标值的平均值;第二:迭代构建树,计算当前模型的残差(即预测误差),使用残差构建一棵新的决策树,拟合这些残差,将这棵树加到模型中,以减少误差;第三:更新模型,重复迭代,逐步增加决策树,直到达到预定的树数量或其他停止条件。1。

2024-08-01 13:46:20 305

原创 SPSSAU | 最好最差权重BWM原理及案例实操分析

BWM(best-worse-method,最好最差法)是一种多准则决策方法,由Jafar Rezaei于2015年提出,其通常用于确定决策标准的权重。其原理是比如5个指标,如果以前AHP就需要5个指标两两的相对重要性数据。但是现在简化为先得到‘最优’和‘最差’这2个指标。得到后需要得到BO(Best-to-other)和OW(Others-to-worst)数据,BO表示‘最好指标与各指标’的相对重要性,OW表示‘各指标与最差指标’的相对重要性。那么5个指标BO就5个数字,OW也5个数字。

2024-08-01 11:41:19 477

原创 SPSSAU | Adaboost模型原理及案例实操

AdaBoost(Adaptive Boosting)算法的核心思想是将多个弱分类器组合成一个强分类器。其算法步骤如下:第一:初始化权重,为每个训练样本分配相等的初始权重;第二:训练弱分类器,根据当前样本权重训练一个弱分类器,并计算其错误率;第三:更新权重,增加错分类样本的权重,使后续弱分类器更关注这些样本,减少正确分类样本的权重;第四:组合分类器,将所有弱分类器的加权结果组合起来,形成最终的强分类器;最后:通过反复迭代以上步骤,AdaBoost 能够显著提高分类性能。1。

2024-08-01 11:31:07 1261

原创 Meta分析 | 六步速成法与软件实操高效指南

Meta分析具有多项优势:它操作迅速,无需实验室工作,发表速度快,仅需计算机即可完成。这种方法比人们通常认为的更为简便。遵循以下六个关键步骤,即可有效进行Meta分析:接下来逐个步骤进行简单说明。

2024-07-16 14:27:59 1199

原创 第一次参加数学建模竞赛新手小白备赛经验贴

2024年暑假已经来临,下半年的非常多,许多同学可能是第一次参赛,对于如何准备感到迷茫和无从下手。在这种情况下,我们将分享一些备赛的小技巧,帮助大家在这个暑假更好的入门,即便是零基础的小白也能在数学建模中得心应手。

2024-07-11 16:24:24 1765

原创 实证分析影响关系研究40+回归模型汇总整理

研究自变量X与因变量Y的影响关系时,回归模型是常用的方法。但是不同的回归模型其适用条件不同、种类繁多。SPSSAU目前提供了40多种不同的回归模型,如何选择适合的模型成为关键问题;此外,如何有效分析回归模型的结果也是研究中的重要步骤。接下来就以上相关知识进行汇总和整理。

2024-07-04 14:42:22 1552

原创 机器学习:预测评估8类指标

机器学习:8类预测评估指标。

2024-07-03 10:40:58 1363

原创 SPSS|问卷数据如何进行正态性检验?

p-p图和q-q图都是根据累计分布函数理论计算的,使用它们可以进行数据是何种分布的检验,但是常用于检验数据是否服从正态分布。如果图形中所有店都聚集在直线上,则说明变量分布服从于所要检验的分布,直观说法就是如果散点分布近似‘对角线’则可以认为正态分布。Johnson 转换利用分布族数学原理进行转换,其转换公式相对复杂与数据压缩法和 Box-Cox 变换类似,Johnson 转换后的数 据会相对更加满足正态分布,但是并非转换后数据一定会满足正态分布,而且会丢失数据的原始意义,仅余下数据的相对意义。

2024-07-03 10:31:44 598

原创 统计学期末名词解释说明

一般说明:如果p值小于0.01,则说明至少有99%的把握,如果p值小于0.05(且大于或等于0.01),则说明至少有95%的把握,如果p值小于0.1(且大于或等于0.05),则说明至少有90%的把握。其中A代表某个类别的观察频数,E代表基于H0计算出的期望频数,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。虽然集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称,偏斜程度等等,其中偏度和峰度就是对数据分布形状的测度。

2024-07-01 10:27:14 1145

原创 文本分析|小白教程

尤其是针对非量表数据,但又需要进行信度说明时,文字描述这种分析手段更为重要,建议从3个角度进行说明,分别是预测试情况,数据如何收集,回收正式数据后的数据处理方式。很多时候我们都容易忽略掉无效样本这一处理过程,每次收集的数据都很难满足样本真实认真的回答,因此无效样本处理是重要的一个步骤,把无效样本处理掉后,通常会让信度指标提升。CITC 同样可作为删除题项的依据,它是指某个题项与其他剩余题项总得分数据之间的相关系数,显然 CITC 越低说明对应的题项同质性越差,可考虑删除。这也是常用的信度处理方式。

2024-06-28 18:53:42 1265

原创 科研数据分析常见问题

这个问题的答案导师想听的一定不是书上的定义或者百度百科上拗口的解释(而且答辩紧张的情况下你可能都忘记了),他想听到的一定是你自己对于该方法的认识以及理解,最好使用大白话进行解释。百度百科对于TOPSIS法的解释如下:在答辩之前,对照SPSSAU帮助手册,仔细看一遍论文中涉及的分析方法相关知识;一定要对自己论文所用的方法、理论做到心中有数,导师提问不会脱离你的论文内容;会回答的,有把握讲清楚的:可以大方简单说明理由进行答辩;

2024-05-31 14:07:47 1233

原创 多元回归模型深度解读

常见的处理方式可先对回归分析的因变量进行对数函数的变换,再重新建立线性回归模型,由于篇幅限制本案例暂不演示(提示:若回归分析只是建立X与Y之间的关系,无须根据X预测Y值可信度等,则方差齐性和正态性可以适当放宽。β0为常数项,又称为截距;从上表可知,将年龄,教育年限,工龄,现雇佣年作为自变量,而将工资作为因变量进行线性回归分析,回归模型显著,F=111.783,p

2024-05-31 14:04:00 2481

原创 老奶奶也能看懂的耦合协调度

案例数据连接假如你有这样一组数据:如何进行计算分析耦合协调度呢?耦合协调度模型用于研究两个或两个以上系统的相互作用情况,以及评价各系统间的协调发展程度,如研究经济效益与社会效益的协调情况、长三角协同发展情况、京津冀经济一体化发展协调程度等。一行为一个样本,一列为一个属性。区间化处理。“耦合”用于表示不同系统之间的相互作用强度,耦合协调度模型借用“耦合”概念来评估数据的耦合大小(当前步骤计算的耦合度C值),该值越大意味着系统之间的相互作用强度越强。式中,beta为系统权重;U为系统数据。

2024-05-31 14:01:00 349

原创 方差分析的七种类型

方差分析(ANOVA)是一种用于检验。根据不同的研究设计和数据类型,方差分析可以分为以下7种类型。

2024-05-31 13:50:26 1507

原创 奶奶也能看懂的耦合协调度分析

案例数据连接假如你有这样一组数据:如何进行计算分析耦合协调度呢?耦合协调度模型用于研究两个或两个以上系统的相互作用情况,以及评价各系统间的协调发展程度,如研究经济效益与社会效益的协调情况、长三角协同发展情况、京津冀经济一体化发展协调程度等。一行为一个样本,一列为一个属性。区间化处理。“耦合”用于表示不同系统之间的相互作用强度,耦合协调度模型借用“耦合”概念来评估数据的耦合大小(当前步骤计算的耦合度C值),该值越大意味着系统之间的相互作用强度越强。式中,beta为系统权重;U为系统数据。

2024-05-29 17:12:03 3807

原创 非量表题如何进行信效度分析

效度是指设计的题确实在测量某个东西,一般问卷中使用到。如果是量表类的数据,其一般是用因子分析这种方法去验证效度水平,其可通过因子分析探究各测量量表的内部结构情况,分析因子分析得到的内部结构与自己预期的内部结构进行对比,进而判断效度情况。但如果本身数据不是量表,比如都是些选择题,这些测量项是否有效地测量对应的概念(变量或维度信息),此时无法使用因子分析,此时可考虑使用内容效度,内容效度的概念较为广泛,其是指测量项真实可以测量的文字分析佐证,比如来源于某文献或者得到专家的认可等。

2024-05-29 17:10:01 1108

原创 自学SPSS,有哪些教学视频或书籍推荐?

同时,结合SPSSAU软件的操作界面,对案例进行了深入的解读,使读者能够轻松掌握数据分析的实战技巧。这本书详细涵盖了科研数据分析的全过程,从基础知识入门到高级研究方法的深入应用,依次分为数据分析入门、常用研究方法应用、数据综合评价及预测、问卷数据分析和医学数据分析五大板块。不论是本科生,研究生,文科生,理工生都是适合研读,同时,对于从事科研分析培训、数据分析咨询工作的专业人士来说,也是一本极具参考价值的工具书。即使是零基础的新手,也能通过这套视频教程快速掌握数据分析的核心技能,轻松踏入数据分析的殿堂。

2024-05-29 17:08:58 1574

原创 不用安装process插件,轻松完成中介效应分析

在了解中介效应软件操作之前,需要知道一些中介效应的基础理论。这些理论在后续检验分析过程中都会贯穿始终。中介效应是研究自变量X对因变量Y的影响时,如果X通过影响变量M而对Y产生影响,则X 通过 M 对 Y 产生的影响效果称为中介效应,中介效应属于间接效应,其路径关系为 X→M→Y,整个中介路径上的效应用前半段路径系数 a 乘以后半段路径系数 b 来计算,即。,即X对Y的总效应可分解为直接效应与间接效应,根据这一关系,我们可以计算根据中介变量的个数,只有一个中介变量时称为,中介变量多于一个时称为。

2024-04-29 14:04:56 1266

原创 主观赋权法、客观赋权法、组合赋权法、评价指标体系构建

然后B1的下属二级指标C1~C4构造判断矩阵计算权重值,B2的下属二级指标C5~C8构造判断矩阵计算权重值,B3的下属指标C9~C13构造判断矩阵计算权重值。举例:同时使用熵值法和AHP法, AHP法能够体现专家对不同指标的经验,熵值法可以反映出数据本身提供的信息量特征,两者结合使用不仅可以减少AHP法赋权的主观性,也会减少数据变化导致权重的波动。层次分析法计算指标权重时,一般先计算一级指标权重,再依次计算二级指标权重,然后将一级指标权重和二级指标权重相乘得到综合权重。没有利用原始数据所携带的信息。

2024-04-29 14:00:42 4026

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除