Stanford机器学习 -- 对Linear Regression 的补充

最新推荐文章于 2018-07-14 11:08:41 发布

lovelan2014

最新推荐文章于 2018-07-14 11:08:41 发布

阅读量356

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/u013556011/article/details/46699345

版权

Machine Learning 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Linear Regression的步骤

初始化 parameters θi (i = 0 ,1,……,n）
选择α（学校速率，可以尝试不同的值找到最合适的）
1.设计Cost Function

这里写图片描述

2.对代价函数求导数

这里写图片描述

循环（最终循环结束的条件）：
For循环（对每个参数进行更新）：

这里写图片描述

循环结束的条件：指定一个最小更新误差，每次循环完成后计算误差函数J更新后和更新前的误差，如果小于最小更新误差停止循环。也可以自己设置一个足够大的值。

vertorization(向量化）

这里写图片描述

这是按照Andrew Ng的思路写成的，只是为了编写程序方便，具体用了什么数学知识，也不太懂。

实现代码

.1 python
1.第一种实现用梯度下降法：

from numpy import *
import matplotlib.pyplot as plt 
import numpy as np

def Gd_algorithm( alpha ):

    dataMat =  array([[1,2],[1,4],[1,5],[1,1],[1,6]])
    labelMat = array([2.1,3.5,5.3,0.9,6.1])
    weights = ones((shape(dataMat)[1] , 1)) 

    err_inf = inf
    flag = True

    while  flag :
        flag = False
        error = dot(dataMat , weights).T[0] - labelMat.T
        #print error

        err_sum_new = sum(error ** 2)
        if err_sum_new < err_inf:
            err_inf = err_sum_new
            flag = True
        else:
            break

        for i in range(shape(weights)[0]):
            weights[i] = weights[i] - alpha * (1.0/shape(dataMat)[0]) * dot(error , dataMat.T[i])

    print weights

    plt.scatter(dataMat.T[1] , labelMat)
    x = dataMat.T[1]
    y = weights[0] + weights[1]* x
    plt.plot(x,y)
    plt.show()

这里写图片描述

2用向量化代码编写

from numpy import *
import matplotlib.pyplot as plt 
import numpy as np

def Gd_algorithm( alpha ):

    dataMat =  array([[1,2],[1,4],[1,5],[1,1],[1,6]])
    labelMat = array([[2.1],[3.5],[5.3],[0.9],[6.1]])
    weights = ones((shape(dataMat)[1] , 1))

    err_inf = inf
    flag = True

    while  flag :
        flag = False
        error = dot(dataMat , weights) - labelMat

        err_sum_new = sum(array(error) ** 2)
        if err_sum_new < err_inf:
            err_inf = err_sum_new
            flag = True
        else:
            break

        weights = weights - alpha * (1.0/shape(dataMat)[0]) * dot(dataMat.T , error)

    print weights

    plt.scatter(dataMat.T[1] , labelMat)
    x = dataMat.T[1]
    y = weights.tolist()[0][0] + weights.tolist()[1][0]* x
    plt.plot(x,y)
    plt.show()

运行结果：
这里写图片描述

可以试一下不同的alpha用的时间不太一样。

3用公式计算权重


from numpy import *
import matplotlib.pyplot as plt 
import numpy as np

def algorithm():

    dataMat =  array([[1,2],[1,4],[1,5],[1,1],[1,6]])
    labelMat = array([[2.1],[3.5],[5.3],[0.9],[6.1]])
    weights = ones((shape(dataMat)[1] , 1))

    weights = dot(dot(linalg.inv(dot(dataMat.T , dataMat)) , dataMat.T) , labelMat)

    print weights

    plt.scatter(dataMat.T[1] , labelMat)
    x = dataMat.T[1]
    y = weights.tolist()[0][0] + weights.tolist()[1][0]* x
    plt.plot(x,y)
    plt.show()