欢迎关注”生信修炼手册”!
回归分析是一种广泛使用的统计工具,利用已有的实验数据,通过一个方程来定量的描述变量之间的关系,其中的变量可以分为两类
自变量,也称之为预测变量
因变量,也称之为响应变量
自变量可以有多个,而因变量只有一个,回归的本质就是构建因变量和自变量之间的方程。回归分析有两个经典的用法,第一个就是建模预测,通过构建的回归方程来对新的数据集进行预测,第二个就是用于定量描述变量间的相关性,在GWAS中,就是利用了回归分析的这一用法,本文首先来看下线性回归。
顾名思义,线性回归用线性方程来描述变量之间的关系,根据自变量的个数,又可以划分为一元线性回归和多元线性回归。这里的一元和多元指的就是自变量的个数。以一元线性回归为例,其方程如下
y = ax + b + c
其中x是自变量,y是因变量,a称之为回归系数,b称之为回归常数. c称之为误差,也叫做残差,a和b合称为回归参数,线性回归的目的就是求解回归参数。以探讨身高和体重间的线性关系为例,数据如下
其分布如下所示