机器学习--简单算法和编程实现

机器学习部分算法

week two 4.18
@(My machine learing)

梯度下降和多线性回归

首先

特征缩放

要对输入的m组data进行一个处理
将其放到一个矩阵中方便计算,或者对于不同范围的数据
进行特征缩放,规格化到[-1,1]或者比较接近这个范围
这里写图片描述

X_norm = X;
mu = zeros(1, size(X, 2));
sigma = zeros(1, size(X, 2));
mu=mean(X);
sigma=std(X);
X_norm = (X - repmat(mu,size(X,1),1)) ./ repmat(sigma,size(X,1),1);

###1. 梯度下降

for iter = 1:num_iters

temp=((X*theta)-y)'*X;
theta=theta-alpha*(temp)'/m; 

end
Cost Fuction
temp=(X*theta-y)'*(X*theta-y);

要同时更新,用temp储存,或者上面这种方法
利用导数进行进一步向min靠近

  • 当偏导数为正数的时候,会减小;
  • 当偏导数为负数的时候,会增加。
  • 不论偏导数的符号如何,都会向最小值的方向运动。
  • 每迭代一次,这项的值就会减小,因为随着越来越靠近最小值的过程中,偏导数那项会越来越小,直到趋近于零,或者小于10^-3;
  • 当的初始值就为最小值的时候,迭代过程不做任何跟新
  • 关于alpha的几点注意:
  • 当X较小的时候,每次跟新的幅度就会比较小
  • 当X较大的时候,可能会出现最后不收敛的情况
    To summarize:
    If α is too small: slow convergence.
    If α is too large: may not decrease on every iteration and thus may not converge.
    那如何来取我的alpha呢?
    Make a plot with number of iterations on the x-axis.
    我们可以看一个我们的J(0)这个函数的趋势,画出图像来看,或者有算法来判读。

2.多线性回归问题

Features

简单的理解一下,在一个问题里面一般会有多组变量
比如一个计算一个土地面积时有width 和 length
如果我们只是在做widtha和width^2的平方这样很复杂的去做,我们到的假设函数,反而不如我们把widthlength这样一个简单的假设函数

Polynomial Regression

简单的说就是一次函数不行,就要二次,三次函数等等
可能还是有很多种选择去符合我们的data。

正规分析

梯度下降给了我们一种很好的处理min的方式
还有一种就是正规分析

theta = zeros(size(X, 2), 1);
theta=inv(X'*X)*X'*y;

这种方式直接可以算出什么是最小的参数

比较这两种方式

比较直观的就是
正规分析更简单,但是对于大数据(100000)以上不适用
梯度下降比较复杂但是对于大量data会更好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值