线性模型
文章平均质量分 84
拓端研究室
这个作者很懒,什么都没留下…
展开
-
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
原文链接:http://tecdat.cn/?p=22813本教程为读者提供了使用频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下的使用,以及模型评估的方法。本教程使用教育数据例子进行模型的应用。此外,本教程还简要演示了用R对GLM模型进行的多层次扩展。最后,还讨论了GLM框架中的更多分布和链接函数。本教程包含以下结构。1. 准备工作。2. 介绍GLM。3. 加载教育数据。4. 数据准备。5. 二元(伯努利)Logisti..原创 2021-06-18 15:27:18 · 3927 阅读 · 0 评论 -
拓端tecdat|R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
原文链接:http://tecdat.cn/?p=22302混合效应逻辑回归用于建立二元结果变量的模型,其中,当数据被分组或同时存在固定和随机效应时,结果的对数几率被建模为预测变量的线性组合。混合效应逻辑回归的例子例1:一个研究人员对40所不同大学的申请进行抽样调查,以研究预测大学录取的因素。预测因素包括学生的高中GPA、课外活动和SAT分数。一些学校的选择性较多或较少,所以每所学校的基准录取概率是不同的。学校层面的预测因素包括学校是公立还是私立,目前学生与教师的比例,以及学校的排...原创 2021-04-22 18:45:20 · 4118 阅读 · 0 评论 -
拓端tecdat|R语言信用风险回归模型中交互作用的分析及可视化
原文链接:http://tecdat.cn/?p=21892多元统计分析 中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。通俗来讲就是,当两个或多个因素同时作用于一个结局时,就可能产生交互作用,又称为效应修饰作用(effect modification)。当两个因素同时存在时,所导致的效应(A)不等于它们单独效应相加(B+C)时,则称因素之间存在交互作用。当A=B+C时称不存在交互效应;当A>B+C..原创 2021-04-06 13:09:32 · 2782 阅读 · 0 评论 -
拓端tecdat|R语言分段线性回归分析预测车辆的制动距离
原文链接:http://tecdat.cn/?p=21557分段回归( piecewise regression ),顾名思义,回归式是“分段”拟合的。其灵活用于响应变量随自变量值的改变而存在多种响应状态的情况,二者间难以通过一种回归模型预测或解释时,不妨根据响应状态找到合适的断点位置,然后将自变量划分为有限的区间,并在不同区间内分别构建回归描述二者关系。 分段回归最简单最常见的类型就是分段线性回归( piecewise linear regression ),即各分段内的局部回归均为线性回归。..原创 2021-03-23 17:23:51 · 1480 阅读 · 0 评论 -
拓端tecdat|R语言用普通最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
原文链接:http://tecdat.cn/?p=21379本文我们对逻辑回归和样条曲线进行介绍。logistic回归基于以下假设:给定协变量x,Y具有伯努利分布,目的是估计参数β。回想一下,针对该概率使用该函数是(对数)似然函数对数似然其中。数值方法基于(数值)下降梯度来计算似然函数的最大值。对数似然(负)是以下函数negLogLik = function(beta){ -sum(-y*log(1 + exp(-(X%*%.........原创 2021-03-15 16:53:51 · 1375 阅读 · 1 评论 -
拓端tecdat|R语言中实现广义相加模型GAM和普通最小二乘(OLS)回归
这篇文章探讨了为什么使用广义相加模型 是一个不错的选择。为此,我们首先需要看一下线性回归,看看为什么在某些情况下它可能不是最佳选择。原创 2021-03-08 09:46:40 · 2691 阅读 · 4 评论 -
拓端tecdat|R语言中使用非凸惩罚函数回归(SCAD、MCP)分析前列腺数据
原文链接:http://tecdat.cn/?p=20828本文使用lasso或非凸惩罚拟合线性回归,GLM和Cox回归模型的正则化,特别是最小最大凹度惩罚函数(MCP)和光滑切片绝对偏差惩罚(SCAD),以及其他L2惩罚的选项( “弹性网络”)。还提供了用于执行交叉验证以及拟合后可视化,摘要,推断和预测的实用程序。我们研究前列腺数据,它具有8个变量和一个连续因变量,即将进行根治性前列腺切除术的男性的PSA水平(按对数尺度):X <- data$Xy <- data$...原创 2021-03-05 13:55:12 · 4547 阅读 · 0 评论 -
拓端tecdat|R语言建立和可视化混合效应模型mixed effect model
原文链接:http://tecdat.cn/?p=20631我们已经学习了如何处理混合效应模型。本文的重点是如何建立和可视化混合效应模型的结果。设置本文使用数据集,用于探索草食动物种群对珊瑚覆盖的影响。knitr::opts_chunk$set(echo = TRUE)library(tidyverse) # 数据处理library(lme4) # lmer glmer 模型me_data <- read_csv("mixede.csv")创建一个基...原创 2021-02-26 18:18:18 · 2892 阅读 · 4 评论 -
拓端tecdat|R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
在标准线性模型中,我们假设。当线性假设无法满足时,可以考虑使用其他方法。 多项式回归 扩展可能是假设某些多项式函数,同样,在标准线性模型方法(使用GLM的条件正态分布)中,参数可以使用最小二乘法获得,其中在。即使此多项式模型不是真正的多项式模型,也可能仍然是一个很好的近似值。实际上,根据Stone-Weierstrass定理,如果在某个区间上是连续的,则有一个统一的近似值,通过多项式函.........原创 2021-02-24 17:05:50 · 2624 阅读 · 1 评论 -
拓端tecdat|R语言分布滞后线性和非线性模型(DLM和DLNM)建模
前言本文说明了R包dlnm实现分布式滞后线性和非线性模型(DLM和DLNM)的建模框架的开发。首先,本文描述了除时间序列数据之外的DLM / DLNM方法的一般化方法,在Gasparrini [2014]中有更详细的描述。此外,此插图还说明了其他发展,特别是扩展的预测摘要的定义,现有功能或用户定义功能的灵活应用以及这些功能在回归分析中的更一般用途。本文档中包含的结果并不代表科学发现,而仅出于说.........原创 2020-12-23 15:00:40 · 8647 阅读 · 13 评论 -
拓端tecdat|R语言多项式线性模型:最大似然估计二次曲线
“应用线性模型”中,我们打算将一种理论(线性模型理论)应用于具体案例。通常,我会介绍理论的主要观点:假设,主要结果,并进行示范来直观地解释。这里查看一个真实的案例研究,它包含真实数据,2400个观测值,34个变量。......原创 2020-12-14 11:24:33 · 8785 阅读 · 16 评论 -
R语言使用bootstrap和增量法计算广义线性模型(GLM)预测置信区间
考虑简单的泊松回归。给定的样本,其中,目标是导出用于一个95%的置信区间给出,其中是预测。因此,我们要导出预测的置信区间,而不是观测值,即下图的点原创 2020-09-03 13:20:11 · 2218 阅读 · 1 评论