机器学习第一课week3-成本函数、损失函数、梯度下降

成本函数


逻辑回归的成本函数与线性回归的成本函数只在形式上类似,逻辑回归的成本函数是对损失函数求和,然后求平均。但两者的意义相同,成本函数越低代表参数的拟合效果越好。


 损失函数


由于直接将逻辑回归函数带入成本函数会导致成本函数非凸,会产生多个局部最优解,所以需要引入损失函数,对损失函数求平均值,可以使成本函数变凸(至于为什么还不清楚,后续会想明白这个问题),只有一个最优解,然后可以运行梯度下降,找到拟合效果最好的参数。
损失函数:

L(f_{w,b}(x^{i}),y^{i})=\left\{\begin{matrix}-log(f_{w,b}(x^{i}))\Leftarrow y^{i}=1 & & \\ -log(1-f_{w,b}(x^{i}))\Leftarrow y^{i}=0 & & \end{matrix}\right.

将其简化为

L(f_{w,b}(x^{i}),y^{i})=-y^{i}log(f_{w,b}(x^{i}))-(1-y^{i})log(1-f_{w,b}(x^{i}))

则成本函数:J(w,b)=\frac{1}{m}\sum L

公式含义:在进行数据训练时,当训练数据中的y为1的情况下,f的输出越趋近于1则损失函数越小,代表参数的拟合效果越好。当y为0的情况下,f的输出越趋近于0则损失函数越小,代表参数的拟合效果越好。(f代表预测的概率,范围在0-1)。

以预测肿瘤是良性还是恶性为例,当确定肿瘤为恶性(即y=1),但f的输出远小于1(不认为是恶性肿瘤),则损失函数越大。

有了损失函数后,可以进行逻辑回归的梯度下降,找到最佳参数。

梯度下降

逻辑回归梯度下降函数与线性回归梯度下降函数形式上相同。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值