机器学习-P2 手动实现线性回归算法

一,简单线性回归实现

1,一元线性回归算法

公式:
y = ax + b
a = Σ[(x.i - x.mean)(y.i - y.mean)] / Σ[(x.i - x.mean)**2]
b = y.mean - a*x.mean

num = 0.0
d = 0.0
for x_i, y_i in zip(x, y):
    num += (x_i - np.mean(x)) * (y_i - np.mean(y))
    d += (x_i - np.mean(x)) **2
# 得到回归系数和截距
a = num / d
b = y_mean - a*x_mean
# 单一数据预测
y_hat = a*x +b

绘制出数据与回归函数
在这里插入图片描述

2,封装自己的简单线性回归

class SimpleLinearRegression:

    def __init__(self):
        self.a_ = None
        self.b_ = None

    def fit(self, x_train, y_train):
        """
        训练参数
        :param x_train:属性数据集
        :param y_train: 标签数据集
        :return: a 回归系数,b 截距
        """
        assert x_train.ndim == 1, "一元线性回归只能有一个属性"
        assert len(x_train) == len(y_train), "属性——标签一一对应"

        x_mean = np.mean(x_train)
        y_mean = np.mean(y_train)

        num = 0.0
        d = 0.0
        for x_i, y_i in zip(x_train, y_train):
            num += (x_i - x_mean) * (y_i - y_mean)
            d += (x_i - x_mean) ** 2

        self.a_ = num / d
        self.b_ = y_mean - self.a_ * x_mean

        return self

    def predict(self, x_predict):
        """
        预测一组数据
        :param x_predict:预测数据集
        :return: 预测结果
        """
        assert x_predict.ndim == 1, "只能有一个属性"
        assert self.a_ is not None and self.b_ is not None, "need use .fit()"

        return np.array([self._predict(x) for x in x_predict])

    def _predict(self, x_single):
        """
        对单一数据进行线性回归
        :param x_single: 单一预测数据
        :return: 预测结果
        """
        return self.a_ * x_single + self.b_

    def __repr__(self):
        return "一元线性规划"

使用

创建对象,导入训练数据

reg1 = SimpleLinearRegression1()
reg1.fit(x, y)

进行预测

reg1.predict(np.array([x_predict]))
>>>array([5.2])

3,使用向量运算计算回归系数

向量运算的效率更高
只改变 reg.fit()函数其他不变

def fit(self, x_train, y_train):
        """
        训练参数---使用矩阵乘法代替循环
        :param x_train:属性数据集
        :param y_train: 标签数据集
        :return: a 回归系数,b 截距
        """
        assert x_train.ndim == 1, "一元线性回归只能有一个属性"
        assert len(x_train) == len(y_train), "属性——标签一一对应"
        
        """矩阵乘法代替循环"""
        x_mean = np.mean(x_train)
        y_mean = np.mean(y_train)

        num = (x_train - x_mean).dot(y_train - y_mean)
        d = (x_train - x_mean).dot(x_train - x_mean)
        
        self.a_ = num 
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值