机器学习中的一些常用函数

最新推荐文章于 2021-11-03 11:24:39 发布

yanhe156

最新推荐文章于 2021-11-03 11:24:39 发布

阅读量1.2k

点赞数

分类专栏： Machine Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yanhe156/article/details/84726630

版权

0 目录

便于看着回想

Loss Function
cross entropy
激活函数
sigmoid
其他
softmax
softmax + cross entropy

1 各种Loss Function及其性质

1.1 cross entropy (交叉熵)

注意 $y$ 和 $\hat{y}$ 是向量， $y$ 是one-hot编码的lable（one-hot label vector）， $\hat{y}$ 是预测的每个类别的可能性（the predicted probability vector for all classes）， $y_i$ 和 $\hat{y}_i$ 是向量中的第i个元素。
下面交叉熵函数中的log就是ln，有些资料写法不同，但一般没写底数的log就是ln。

对 $\hat{y}_i$ 的偏导数：
$\frac{\partial{CE(y, \hat{y})}}{\hat{y}_i} = - \frac{y_i}{\hat{y}_i}$

2 激活函数及其性质和导数

2.1 sigmoid

$\sigma(x) = \frac{1}{1+e^{-x}}$

导数（求导非常容易）：
$\sigma'(x) = \frac{e^{-x}}{(1+e^{-x})^2} = \sigma(x)(1-\sigma(x))$

3 其他

3.1 softmax

$softmax(x_i) =\frac{ e^{x_i} }{\sum_j{e^{x_j}}}$

导数：softmax和sigmoid其实很像，分子分母同除以 $e^{x_i}$ ，得到 $softmax(x_i) =\frac{1}{ 1+ e^{-x_i}\sum_{j \not= i}{e^{x_j}}}$ ，这样就很容易看出和sigmoid很像了，所以其对 $x_i$ 的偏导数和sigmoid的导数很像。
$\frac{\partial softmax(x_i)}{\partial x_i} =\frac{e^{-x_i}\sum_{j \not= i}{e^{x_j}}}{( 1+ e^{-x_i}\sum_{j \not= i}{e^{x_j}})^2} = softmax(x_i)(1 - softmax(x_i))$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
机器学习中的一些常用函数

总结各种Loss Function以及其优良性质。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。