center loss的完全理解以及实现

最新推荐文章于 2022-08-17 14:15:16 发布

herr_kun

最新推荐文章于 2022-08-17 14:15:16 发布

阅读量2.1k

点赞数 2

分类专栏： CV 文章标签： center loss softmax embedding keras

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/herr_kun/article/details/107668745

版权

本文详细探讨了Center Loss的原理，指出类别中心的动态变化方式，并通过对比两种更新策略，揭示了在每个batch内计算动态变化的合理性。重点介绍了如何利用Keras中的Embedding层实现Center Loss，并提供了相关资源链接。

摘要由CSDN通过智能技术生成

最近项目中需要 center loss 提升模型的效果，但是 center loss 的实现就有点不确定，看了很多的博客，基本都是臆测，还是看源码来的实在。

下面就大致说下 center loss 的实现：

1、原理：

原理这块大家可以参考别人的博客，或者paper，这里就简单叙述下：让得到全连接层向量距离对应类别中心的距离最小

2、问题

类别中心是动态变化的么？如何进行变化？

（1）是每个epoch结束后使用所有的样本重新聚类计算得到样本中心么？

（2）在每个batch内计算动态变化得到聚类中心

当然是第二种方式，第一种方式太过于直白，最大的问题就是更新的太滞后了，基本上业界没有这样用的。
那么第二种方式该如何实现？每个batch内不一定包含所有的类别图像，维护一个参数矩阵？如何初始化？如何得到类别中心点（聚类还是求均值？）？

3、具体的实现

确实需要一个参数矩阵来维护并更新我们得到的聚类中心，常规能想到的方式就是自定义一个layer，然后再layey种定义参数矩阵等等，最终加入模型进行训练.

还有一种更为简洁的方式就是使用 Embedding 层的方式进行辅助训练，Embedding 层不仅仅可以实现一个维度的映射，而且最重要的是该层里面也有参数，是一个可以被训练的层，因此一切到这里就可以结束了ÿ

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。