机器学习-线性回归-衡量指标、多元回归（2.2）

最新推荐文章于 2023-06-08 06:30:19 发布

moonbaby1

最新推荐文章于 2023-06-08 06:30:19 发布

阅读量1.1k

点赞数

分类专栏： # 机器学习算法

本文链接：https://blog.csdn.net/hhcharming/article/details/105640389

版权

机器学习算法专栏收录该内容

14 篇文章 0 订阅

订阅专栏

3. 实现我们自己的 Linear Regression（波士顿房价）

四.scikit-learn中的回归问题

一.评测标准

1.MSE

mse_test = np.sum((y_predict - y_test)**2) / len(y_test)

2.RMSE

rmse_test = sqrt(mse_test)

3.MAE

mae_test = np.sum(np.absolute(y_predict - y_test))/len(y_test)

4.封装测评

该函数类定义在metrics.py里面

import numpy as np
from math import sqrt


def accuracy_score(y_true, y_predict):
    """计算y_true和y_predict之间的准确率"""
    assert len(y_true) == len(y_predict), \
        "the size of y_true must be equal to the size of y_predict"

    return np.sum(y_true == y_predict) / len(y_true)


def mean_squared_error(y_true, y_predict):
    """计算y_true和y_predict之间的MSE"""
    assert len(y_true) == len(y_predict), \
        "the size of y_true must be equal to the size of y_predict"

    return np.sum((y_true - y_predict)**2) / len(y_true)


def root_mean_squared_error(y_true, y_predict):
    """计算y_true和y_predict之间的RMSE"""

    return sqrt(mean_squared_error(y_true, y_predict))


def mean_absolute_error(y_true, y_predict):
    """计算y_true和y_predict之间的MAE"""
    assert len(y_true) == len(y_predict), \
        "the size of y_true must be equal to the size of y_predict"

    return np.sum(np.absolute(y_true - y_predict)) / len(y_true)


def r2_score(y_true, y_predict):
    """计算y_true和y_predict之间的R Square"""

    return 1 - mean_squared_error(y_true, y_predict)/np.var(y_true)

jupter中调用

scikit-learn中的MSE和MAE

二.R Squared

在metric.py里面封装我们自己的 R Score（见上面代码）

scikit-learn中的 r2_score

三.多元线性回归

使用更多特征

1.概念

多元线性回归不需要做归一化处理。

2.实现多元线性回归

在spder中封装我们自己的函数：

LinearRegression.py

import numpy as np
from .metrics import r2_score

class LinearRegression:

    def __init__(self):
        """初始化Linear Regression模型"""
        self.coef_ = None
        self.intercept_ = None
        self._theta = None

    def fit_normal(self, X_train, y_train):
        """根据训练数据集X_train, y_train训练Linear Regression模型"""
        assert X_train.shape[0] == y_train.shape[0], \
            "the size of X_train must be equal to the size of y_train"

        X_b = np.hstack([np.ones((len(X_train), 1)), X_train])
        self._theta = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y_train)

        self.intercept_ = self._theta[0]
        self.coef_ = self._theta[1:]

        return self

    def predict(self, X_predict):
        """给定待预测数据集X_predict，返回表示X_predict的结果向量"""
        assert self.intercept_ is not None and self.coef_ is not None, \
            "must fit before predict!"
        assert X_predict.shape[1] == len(self.coef_), \
            "the feature number of X_predict must be equal to X_train"

        X_b = np.hstack([np.ones((len(X_predict), 1)), X_predict])
        return X_b.dot(self._theta)

    def score(self, X_test, y_test):
        """根据测试数据集 X_test 和 y_test 确定当前模型的准确度"""

        y_predict = self.predict(X_test)
        return r2_score(y_test, y_predict)

    def __repr__(self):
        return "LinearRegression()"

3. 实现我们自己的 Linear Regression（波士顿房价）

四.scikit-learn中的回归问题

moonbaby1

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
机器学习-线性回归-衡量指标、多元回归（2.2）

一.评测标准1.MSEmse_test = np.sum((y_predict - y_test)**2) / len(y_test)2.RMSErmse_test = sqrt(mse_test)3.MAEmae_test = np.sum(np.absolute(y_predict - y_test))/len(y_test)4.封装测评该函数类定义...
复制链接

扫一扫

专栏目录