主成分回归之后预测_对基于降维（特征、成分）的回归方法作个简介-CSDN博客

本文链接：https://blog.csdn.net/weixin_29576039/article/details/112539112

主成分回归(PCR)是将主成分分析(PCA)与线性回归结合的方法，通过降维处理自变量，减少模型复杂性，避免多重共线性，利于趋势特征建模。PCR通常包括三个步骤：主成分分析、使用主成分进行回归和计算模型参数。降维方法和回归方法可灵活选择，适用于高维数据的建模，但可能难以解释变量效应。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对那些基于降维(特征、成分)的回归方法作个简介

很多生物学数据集具有高维的特征，体现在变量数量非常多且存在高度共线性，难以通过常规的多元回归分析变量间关系。在前文基于相似或相异度矩阵的多元回归( MRM ) 中，提到了一种替代方法是可以根据多变量数据计算所有样本之间的相似度或距离，然后基于相似或相异度矩阵执行回归分析，解释一组变量对另一组变量的整体效应。本篇列举另一种方法，基于降维的回归。备注：这个方法的名称是白鱼同学瞎取的，因为实在不知道该怎么称呼，有些片面 ...... 基于降维的回归、基于特征的回归、基于成分的回归等等，怎么叫都行吧 ...... 算了名称无所谓了，看了下文的方法过程描述就知道是怎么一回事了。

基于降维(特征、成分)的回归的计算原理

这类方法是个统称。简单来说，就是首先自变量进行降维处理，将原始的大量自变量减少为较少的一组不相关成分，这些成分代表了原始自变量的特征组合，并对这些成分(而非原始的自变量)执行回归的过程。

基于降维的回归方法中，最具代表性的一个子类别就是主成分回归(Principal Component Regression，PCR)，它是主成分分析(PCA)和普通最小二乘(OLS)回归的结合，最简单也最容易理解。就以主成分回归为例，包含三个步骤：

(1)使用所有的自变量运行主成分分析(PCA)，对自变量进行降维，获得一组互不相关(正交)的主成分，这些主成分承载了原始变量的方差；

(2)使用主成分代替原始的自变量，运行普通最小二乘(OLS)回归，也就是通过线性回归建立这些主成分与响应变量的线性关系；

(3)计算与输入变量相对应的模型参数。

其它类别的基于降维的回归方法在主成分回归的基础上延伸得来。实际的应用中，根据具体情况选择合适的方法，总之非常灵活多样：

(1)降维方法不局限于PCA，也可以是主坐标分析(PCoA)、非度量多维标度(NMDS)等；

(2)回归方法不局限于线性回归，也可以是其它类型的非线性回归等。

基于降维(特征、成分)的回归的特点

下文简单概括这类方法的特点。

在一定程度上降低模型的复杂性