神经网络学习笔记DAY2

最新推荐文章于 2024-05-20 22:25:53 发布

L丫丫

最新推荐文章于 2024-05-20 22:25:53 发布

阅读量93

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mynameislfc/article/details/105181829

版权

@吴恩达神经网络学习DAY2

一、向量化

向量化的目的主要是减少for循环，在此项应用中，可以通过python/numpy中的np.not进行向量之间的点乘、np.sum进行矩阵之间相加等等。。。
向量化的运算速度比for 循环快百倍有余。

二、logistic回归成本函数证明

为什么要用这样一个函数作为成本函数呢？
首先我们定义了样本结果：
$\hat y=\sigma(w^T+b)$ ,
where $\sigma(z)=\frac{1}{1+e^{-z}}$

其中， $\hat y=p(y=1|x)$
如果， $y = 1$ ， $p(y|x)=\hat y$
如果， $y = 0$ ， $p(y|x)=1-\hat y$
因此将上式进行合并
得到： $p(y|x)=\hat y^y(1-\hat y)^{(1-y)}$
由于log函数是严格的单调递增函数
因此： $logp(y|x)=log(\hat y^y(1-\hat y)^{(1-y)})$
$=ylog\hat y+(1-y)log(1-\hat y)$
$=-L(\hat y,y)$ …(损失函数的负值)
对损失函数添加负号的原因在于：希望log函数趋于最大时，损失函数趋于最小。

以上是只包含一个样本的情况下，若包含m个样本。
$log(p(m个样本))=log\prod_{i=1}^mp(y^{(i)}|x^{(i)})$
假设每个样本之间相互独立
$=\sum_{(i=1)}^mlog(p(y^{(i)})|x^{(i)})$
$=\sum_{(i=1)}^m-L(\hat y^{(i)},y^{(i)})$
$=-\sum_{(i=1)}^mL(\hat y^{(i)},y^{(i)})$
由于训练模型时，目标是让成本函数最小化，则需去掉上式中的负号：
成本函数 $J(w,b)=\sum_{(i=1)}^mL(\hat y^{(i)},y^{(i)})$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络学习笔记DAY2

@吴恩达神经网络学习DAY2一、向量化向量化的目的主要是减少for循环，在此项应用中，可以通过python/numpy中的np.not进行向量之间的点乘、np.sum进行矩阵之间相加等等。。。向量化的运算速度比for 循环快百倍有余。二、logistic回归成本函数证明为什么要用这样一个函数作为成本函数呢？首先我们定义了样本结果：y^=σ(wT+b)\hat y=\sigma(w^T...
复制链接

扫一扫

L丫丫 CSDN认证博客专家 CSDN认证企业博客

码龄7年

8: 原创

37万+: 周排名

23万+: 总排名

3673: 访问

: 等级

92: 积分

0: 粉丝

5: 获赞

1: 评论

14: 收藏

私信

关注

热门文章

最新评论

torch_sparse安装
CSDN-Ada助手: 恭喜你写了第9篇博客！标题为“torch_sparse安装”，非常感谢你分享关于这个主题的知识。在你的博客中，我发现了一些有关torch_sparse安装的有用信息。你的文章对于那些想要使用torch_sparse的人来说，肯定是非常有帮助的。接下来，我希望你可以继续深入探索torch_sparse的更多功能和用法，并与我们分享你的发现。谢谢你的付出，期待你未来更多的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。