集成学习——回归

最新推荐文章于 2024-07-28 18:14:41 发布

0newest

最新推荐文章于 2024-07-28 18:14:41 发布

阅读量801

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_42569216/article/details/118772473

版权

这篇博客介绍了回归分析在机器学习中的应用，包括回归任务的定义、使用sklearn构建回归项目的步骤、线性回归模型的原理和推广，以及与其他模型如回归树和支持向量机回归的对比。此外，还探讨了线性回归的最小二乘估计和多项式回归的局限性，并给出了相关作业和参考资料。

摘要由CSDN通过智能技术生成

收集数据集并选择合适的特征
选择度量模型性能的指标：
- MSE均方误差： $\text{MSE}(y, \hat{y}) = \frac{1}{n_\text{samples}} \sum_{i=0}^{n_\text{samples} - 1} (y_i - \hat{y}_i)^2.$
- MAE平均绝对误差: $\text{MAE}(y, \hat{y}) = \frac{1}{n_{\text{samples}}} \sum_{i=0}^{n_{\text{samples}}-1} \left| y_i - \hat{y}_i \right|$
- $R^2$ 决定系数： $R^2(y, \hat{y}) = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}$
- 解释方差得分: $explained\_{}variance(y, \hat{y}) = 1 - \frac{Var\{ y - \hat{y}\}}{Var\{y\}}$
选择具体的模型并进行训练
- 线性回归模型：
  
  假设目标值与特征之间线性相关，即满足一个多元一次方程。通过构建损失函数，来求解损失函数最小时的参数w ：
  
  假设：数据集 $D = \{(x_1,y_1),...,(x_N,y_N) \}$ ， $x_i \in R^p,y_i \in R,i = 1,2,...,N$ ， $X = (x_1,x_2,...,x_N)^T,Y=(y_1,y_2,...,y_N)^T$
  
  假设X和Y之间存在线性关系，模型的具体形式为 $\hat{y}=f(w) =w^Tx$
```
from sklearn import linear_model      # 引入线性回归方法
lin_reg = linear_model.LinearRegression()       # 创建线性回归的类
lin_reg.fit(X,y)        # 输入特征X和因变量y进行训练
print("模型系数：",lin_reg.coef_)             # 输出模型的系数
print("模型得分：",lin_reg.score(X,y))    # 输出模型的决定系数R^2
```
- 最小二乘估计：
  
  衡量真实值 $y_i$ 与线性回归模型的预测值 $w^Tx_i$