吴恩达讲解：经典部分-逻辑回归-反向传播算法

最新推荐文章于 2024-02-22 09:30:00 发布

dxz_tust

最新推荐文章于 2024-02-22 09:30:00 发布

阅读量3.9k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daixiangzi/article/details/78010558

版权

深度学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

假设有1个样本，其中每个样本中的特征为2个，分别为X1,X2

z=w^Tx+b

a=sigmoid(z ) 预测概率

**成本函数为L=-（yloga+(1-y)log(1-a))**

反向更新:

**w1:=w1-learn_rate*dw1**

**w2:=w2-learn_rate*dw2**

**b:=b-learn_rate*db**

其中dw1,dw2,db 分别是L(a,y)的导数

剩下的任务就是求上面三个变量的导数了

过程省略

**dw1=x1*dz**

**dw2=x2*dz**

db=dz

其中dz=a-y

接下来，我们利用上面的原理对m个样本进行梯度下降算法

刚开始令所有变量为0

L=0,dw1=0,dw2=0,db=0

for i in m:

z(i)=w^Tx(i)+b

a(i)=1/(1+e^z(i))

**L+=-（y(i)loga(i)+(1-y(i))log(1-a(i)) #累加所有损失和变化量**

**dw1+=x1(i)*dz(i)**

**dw2+=x2(i)*dz(i)**

db+=dz(i)

L/=m dw1/=m dw2/=m db/=m #求每个变量的均值

**w1:=w1-learn_ratedw1 #最后更新每个参数

w2:=w2-learn_ratedw2

b:=b--learn_rate*db

这只是针对一个样本的例子，如果需要用到多个样本，就需要写两个循环，外循环遍历特征。内循环累加各个变量。

但是如果按照这样for 循环写算法肯定是不行的，一旦数据到达百万千万级的时候，效率会降低**

所以我们可是使用python or matlab进行批量的矩阵计算，这种速度效率比for 循环是高的

进行一个向量化改进:

L=0,dw1=0,dw2=0,db=0 #向量化W=np.zeros((m,1))

for i in m:

z(i)=w^Tx(i)+b

a(i)=1/(1+e^z(i))

**L+=-（y(i)loga(i)+(1-y(i))log(1-a(i)) #累加所有损失和变化量**

**dw1+=x1(i)dz(i) #向量化 dw+=x(i)dz(i)**

**dw2+=x2(i)*dz(i)**

db+=dz(i)

L/=m dw1/=m dw2/=m db/=m #求每个变量的均值向量化dw/=m

**w1:=w1-learn_ratedw1 #最后更新每个参数

w2:=w2-learn_ratedw2

b:=b--learn_rate*db**

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
吴恩达讲解：经典部分-逻辑回归-反向传播算法

假设有1个样本，其中每个样本中的特征为2个，分别为X1,X2z=w^Tx+ba=sigmoid(z ) 预测概率成本函数为L=-（y*loga+(1-y)*log(1-a))反向更新:w1:=w1-learn_rate*dw1w2:=w2-learn_rate*dw2b:=b-learn_rate*db其中dw1,dw2,db 分别是L(a,y)的导数剩下
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。