机器学习笔记-线性回归

最新推荐文章于 2023-03-05 00:00:53 发布

囧囧慧君

最新推荐文章于 2023-03-05 00:00:53 发布

阅读量74

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_46347116/article/details/119618212

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

机器学习笔记-线性回归

线性回归概述

线性回归概述

概述

原理

$X 1$ 是年龄特征， $X 2$ 是业绩特征， $Y$ 是收入

年龄	业绩	收入
28	700	9000
45	800	8000
33	400	6000
40	350	4000
20	403	6000
39	250	8000

$\theta_0$ 是偏置参数， $\theta_1$ 是年龄参数， $\theta_2$ 是成绩参数，找一个高维的的线/面拟合数据
$h_\theta(x) = \theta_0 + \theta_1x_1 + \theta_2x_2\\$
转换为矩阵表达为：
$h_\theta(x) = \sum_{i=0}^m \theta_i x_i = \theta^T x$
预测值与真实值之间的误差用 $\epsilon$ 表示：
$y^{(i)} = \theta^T x^{(i)} + \epsilon^{(i)}$
误差 $\epsilon^{(i)}$ 是独立并且具有相同服从均值为0，方差为 $\theta^2$ 的高斯分布，独立：甲和乙没有关系，不互相影响，同分布：甲和乙都是在这个公司工作，由于 $\epsilon^{(i)}$ 服从高斯分布，因此：
$\left( \epsilon^{(i)} \right) = \frac 1 { \sqrt{2 \pi}\sigma } e^{ \left( - \frac {\left( \epsilon^{(i)} \right)^2}{2\sigma^2}\right)}$
将 $y^{(i)} = \theta^T x^{(i)} + \epsilon^{(i)}$ 代入上式：
$\left( y^{(i)} | x^{(i)}; \theta \right) = \frac 1 { \sqrt{2 \pi}\sigma } e^{ \left( - \frac {\left( y^{(i)} - \theta^T x^{(i)}\right)^2}{2\sigma^2}\right)}$
什么样的参数和我们的数据组合恰好是真实值，用似然函数：
$L(\theta) = \prod_{i=1}^{m} p \left( y^{(i)} | x^{(i)}; \theta \right) = \prod_{i=1}^{m} \frac 1 { \sqrt{2 \pi}\sigma } e^{ \left( - \frac {\left( y^{(i)} - \theta^T x^{(i)}\right)^2}{2\sigma^2}\right)}$
为求解方便转化为对数似然函数：
$\begin{aligned} logL(\theta) &= log \prod_{i=1}^{m} \frac 1 { \sqrt{2 \pi}\sigma } e^{ \left( - \frac {\left( y^{(i)} - \theta^T x^{(i)}\right)^2}{2\sigma^2}\right)} \\ &=\sum_{i=0}^m log\left( \frac 1{ \sqrt{2 \pi}\sigma } e^{ \left( - \frac {\left( y^{(i)} - \theta^T x^{(i)}\right)^2}{2\sigma^2}\right)}\right)\\ &= m log \frac 1{ \sqrt{2 \pi}\sigma} - \frac1{2 \sigma^2} \sum_{i=0}^m ( y^{(i)} - \theta^T x^{(i)})^2 \end{aligned}$
转换为的目标函数：
$\begin{aligned} J(\theta) &= \frac 12 \sum_{i=0}^m ( y^{(i)} - \theta^T x^{(i)})\\ &= \frac 12 \sum_{i=0}^m (y^{i} - h_\theta{(x^i)})^2 \end{aligned}$

批量梯度下降：
$\begin{aligned} \frac {\partial J (\theta)}{\partial (\theta)} &= - \sum_{i=0}^m (y^{i} - h_\theta{(x^i)})x_j^i\\ \theta '_j&= \theta _j+ \sum_{i=0}^m (y^{i} - h_\theta{(x^i)})x_j^i \end{aligned}$
批量梯度下降容易得到最优解，但每次考虑所有样本，速度慢
随机梯度下降：
$\theta '_j= \theta _j+ (y^{i} - h_\theta{(x^i)})x_j^i$
随机梯度下降每次找一个样本，迭代速度快，但每次不一定朝着收敛的方向
小批量梯度下降：
$\theta '_j= \theta _j- \alpha \frac {1}{10} \sum_{k=i}^{i+9} (y^{(k)} - h_\theta{(x^{(k)})})x_j^{k}$
每次更新选择一小部分数据来算，实用

学习率：尽量选择小一些的学习率
批处理数量：32,64,128都课可以
评估方法 $R^2$ ， $R^2$ 取值越接近于1，模型拟合越好:
$1-\frac { \sum_{i=0}^m(\hat y_i - y_i)^2 }{\sum_{i=0}^m(y_i-\overline y_i)^2}$

实现代码

class linear(object):
    def __init__(self):
        self.W = None
        self.b = None
    
    def loss(self,X,y):
        num_feature  = X.shape[1]
        num_train = X.shape[0]
        # 2.1 计算当前权重及偏置下预测值
        h = X.dot(self.W) + self.b
        # 2.2 计算损失值
        loss = 0.5 *np.sum(np.square(h - y)) / num_train
        # 2.3 计算当前梯度
        dW = X.T.dot((h-y)) / num_train
        db = np.sum((h-y)) / num_train
        
        return loss,dW,db
        
    def train(self,X,y,learn_rate = 0.001,iters = 10000):
        num_feature = X.shape[1]
        # 1.初始化权重参数
        self.W = np.zeros((num_feature,1))
        # 1.初始化偏置参数
        self.b = 0
        loss_list = []
        
        for i in xrange(iters):
            # 2.计算损失值
            loss,dW,db = self.loss(X,y)
            loss_list.append(loss)
            # 3.更新权重与偏置参数
            self.W += -learn_rate*dW
            self.b += -learn_rate*db
            
            if i%500 == 0:
                print 'iters = %d,loss = %f' % (i,loss)
        return loss_list
        
    def predict(self,X_test):
        y_pred = X.dot(self.W) + self.b
        return y_pred
    
    pass

囧囧慧君

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记-线性回归

机器学习笔记-线性回归欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Ma
复制链接

扫一扫

专栏目录