吴恩达机器Deeplearning.ai课程学习记录:分类问题(3)

目录

实现梯度下降

过拟合问题

什么是过拟合?

解决过拟合问题

增加数据量(水多了加面法)

减少数据特征数(水多了吸水法)

正则化 Regularization


实现梯度下降

有了代价函数之后,就可以开始拟合啦。

先回顾下代价函数::

J(w,b)=\frac{1}{m}\sum L(f(x^i),y^i)

L(f_{w,b}(x^{(i)}),y^{(i)})= -y^i\cdot log( f(x^i)) -(1-y^i)log(1-f(x^i))

类似于线性回归,可以先写出repeat的部分,即对w,b进行修正:

w_j=w_j-\alpha\cdot\frac{\partial }{\partial w_j}J(w,b)\\ b = b - \alpha\cdot\frac{\partial}{\partial b}J(w,b)

后面偏导数的部分可以化简:

\alpha\cdot\frac{\partial }{\partial w_j}J(w,b)=\frac{1}{m}\sum (f(x^i)-y^i)x^i_j

\alpha\cdot\frac{\partial}{\partial b}J(w,b)=\frac{1}{m}\sum (f(x^i)-y^i)

这一步的推导我感觉好复杂┭┮﹏┭┮,我找到了详细的推到过程:链接

过拟合问题

这是一个非常常见的问题,如果你有过科研或者项目经历,很多项目都会专门处理这个问题。

什么是过拟合?

用我自己的话说,就是一开始,随着维度增加,显而易见结果会更加准确,但是当到达某个阶段,你添加更多维度,会导致你的结果准确度不咋上升甚至下降,例子如下图:

第三个图的拟合曲线精确地通过了每个点,我个人感觉,是因为提供的数据本身就具有误差,过于拟合数据的曲线使得你的拟合中将数据的误差给继承了,这就称为过拟合(overfit),也可以叫做高方差(high variance)

过拟合同样也存在于分类问题,这里不多赘述。

解决过拟合问题

有多种方法来解决过拟合问题

增加数据量(水多了加面法)

我感觉,出现过拟合主要就是数据量和维度之间未达到平衡(阴阳玄学是吧),本着水多了加面,面多了加水的原则,可以增加数据量从而提高拟合效果。

减少数据特征数(水多了吸水法)

这个也很好理解,去掉几项特征就好啦,但是这种方法可能会导致你丢失掉一些重要的特征,要谨慎/(ㄒoㄒ)/~~。

当然,正因为直接粗暴的将某些特征变为0这样的方法过于粗暴,所以就出现了下面一种更加常用的方法——正则化

正则化 Regularization

简而言之,正则化就是将某些特征的系数改变,从而降低其对于整个回归的影响。

从这两幅图可以从可视化的角度看出正则化的作用所在。右图将x的3、4次幂的系数进行了缩小,从而降低了影响,同时也保留了所有的特征。

一般来说正则化只会改变Wn的大小,改变b对于结果并无影响。

在下面一小节将展开讲解正则化有关内容。

  • 15
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

江安的猪猪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值