Ensemble Learning Task 2

最新推荐文章于 2024-07-25 08:20:58 发布

DataVVhale

最新推荐文章于 2024-07-25 08:20:58 发布

阅读量76

点赞数

分类专栏：集成学习文章标签：数据挖掘机器学习 python

本文链接：https://blog.csdn.net/baidu_36184635/article/details/114984223

版权

集成学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Ensemble Learning Task 2
学习地址：https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearning

Task 2 的主要学习内容是 使用sklearn构建完整的回归项目

收集数据集并选择合适的特征
选择度量模型性能的指标
选择具体的模型并进行训练

一般来说，一个完整的机器学习项目分为以下步骤：

明确项目任务：回归/分类
收集数据集并选择合适的特征。
选择度量模型性能的指标。
选择具体的模型并进行训练以优化模型。
评估模型的性能并调参。这里是引用

数据和特征构建：数据我们使用的是Boston房价预测数据集，通过对data, target, feature_names等数据的调用和组合，构造了用于训练的数据
模型度量指标：

MSE均方误差： $\text{MSE}(y, \hat{y}) = \frac{1}{n_\text{samples}} \sum_{i=0}^{n_\text{samples} - 1} (y_i - \hat{y}_i)^2.$
MAE平均绝对误差: $\text{MAE}(y, \hat{y}) = \frac{1}{n_{\text{samples}}} \sum_{i=0}^{n_{\text{samples}}-1} \left| y_i - \hat{y}_i \right|$
$R^2$ 决定系数： $R^2(y, \hat{y}) = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}$
解释方差得分: $explained\_{}variance(y, \hat{y}) = 1 - \frac{Var\{ y - \hat{y}\}}{Var\{y\}}$

本案例使用的是MSE均方误差为模型进行性能度量。

模型训练
模型训练部分介绍了几种常用的模型：

线性回归

from sklearn import linear_model      # 引入线性回归方法
lin_reg = linear_model.LinearRegression()       # 创建线性回归的类
lin_reg.fit(X,y)        # 输入特征X和因变量y进行训练
print("模型系数：",lin_reg.coef_)             # 输出模型的系数
print("模型得分：",lin_reg.score(X,y))    # 输出模型的决定系数R^2

回归树

from pygam import LinearGAM
gam = LinearGAM().fit(boston_data[boston.feature_names], y)
gam.summary()

支持向量机回归(SVR)

from sklearn.svm import SVR
from sklearn.preprocessing import StandardScaler     # 标准化数据
from sklearn.pipeline import make_pipeline   # 使用管道，把预处理和模型形成一个流程

reg_svr = make_pipeline(StandardScaler(), SVR(C=1.0, epsilon=0.2))
reg_svr.fit(X, y)
reg_svr.score(X,y)

后续会学习基础模型的优化以及调参，形成完整回归项目。

DataVVhale

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Ensemble Learning Task 2

Ensemble Learning Task 2学习地址：https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearningTask 2 的主要学习内容是使用sklearn构建完整的回归项目收集数据集并选择合适的特征选择度量模型性能的指标选择具体的模型并进行训练一般来说，一个完整的机器学习项目分为以下步骤：明确项目任务：回归/分类收集数据集并选择合适的特征。选择度量模型性
复制链接

扫一扫

专栏目录