Andrew机器学习笔记2:逻辑回归 logistic regression

根据斯坦福大学Andrew NG的机器学习课程整理。

1.分类 classification

预测值y为离散值 :

y01{0: negative class 1: positive class

2.Sigmoid function(S函数)

由于分类问题的输出值为0 or 1, 我们期望假设函数h的输出也能在(0,1)这个范围内,最好能够满足:

{hθ(x)0.5hθ(x)<0.5y=1y=0

而S函数能够很好的满足这个性质:
g(x)=11+ex


因此,逻辑回归的假设函数可以写成:
hθ(x)=g(θTx)=11+eθTx

由S函数图像可知,当 θTx0 时,y=1,当 θTx<0 时,y=0。

3.代价函数和梯度下降

线性回归代价函数:

J=12mi=1m(hθ(x(i))y(i))2

将逻辑回归的假设函数h带入,得到的J非常复杂,并且包含多个局部最优解。

定义逻辑回归的代价函数为:
J(θ)=1mi=1m[yilog(hθ(x(i))+(1y(i))log(1hθ(x(i)))]

重写后的代价函数为凸函数,可以使用梯度下降算法求取 θ
θj=θjαθjJ(θ)=θjαmi=1m(hθ(x(i))y(i))x(i)j

梯度:
θj=1mi=1m(hθ(x(i))y(i))x(i)j

4.高级优化函数-fminunc

matlab包含高级函数,能够自动调用高级优化函数,不用设定学习率 α 且计算速度比梯度下降快。

options = optimset('GradObj', 'on', 'MaxIter', 400);
[theta, cost,exit_flag] = ...
    fminunc(@(t)(costFunction(t, X, y)), initial_theta, options);

options:数据结构,存储想要的数据;GradObj on, 设置梯度目标函数打开,给算法提供一个梯度;MaxIter 400, 设置迭代次数为400次。
costFunction(t, X, y):计算代价J、梯度
exit_flag:返回值为1时,表明模型已经收敛。

5.正则化(regularization)

过拟合(over fitting)
过拟合:当变量过多时,训练得到的假设函数h总能很好地拟合训练数据(代价函数J非常接近0),但无法泛化到新的数据样本中。
泛化:一个假设模型应用到新样本的能力。
解决办法:

  • 一维or二维数据:绘制假设模型图像,研究问题所在,再选择适合的多项式。
  • 多特征变量:
    1. 减少特征数量:人为检测哪些特征更重要,决定保留/舍弃某些特征;模型选择算法,自动选择采用哪些特征。
    2. 正则化:保留所有特征,减小 θj 的数量级/值。

正则化(regularization)
正则化思路:对参数 θ0,θ1,...,θn 取小值,会得到形式上更简单的假设(曲线更光滑)。

J(θ)=12m[i=1m(hθ(x(i))y(i))2+λj=1nθ2j

λnj=1θ2j 正规化项不包含 θ0
λ :控制前后两部分的平衡关系。( λ 过大,导致 θ 参数过小, hθ=θ0 ,欠拟合。)
线性回归正则化:
梯度下降:
θ0=θ0αmi=1m(hθ(x(i))y(i))x(i)0

θj=θj(1αλm)αmi=1m(hθ(x(i))y(i))x(i)j

正规方程:
θ=(xTx+λ011)1xTy

逻辑回归正则化:
J(θ)=1mi=1m[y(i)log(hθ(x(i)))(1y(i))log(1hθ(x(i)))]+λ2mj=1nθ2j

θ0=θ0αmi=1m(hθ(x(i))y(i))x(i)0

θj=θjα[1mi=1m(hθ(x(i))y(i))x(i)j+λmθj]

选取不同的 λ 结果对比
λ 取0,即不加正则化–过拟合

λ 取1,选取比较合适

λ 取100,取值过大–欠拟合

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值