胶囊网络paper读后总结

文章的主要逻辑框架为:编码器+解码器,下图是1编码器的流程,图2为解码器的流程。

 

                                                                                                图1

如上图1所示:输入的手写体mnist图像的尺寸为28*28,经过256个9*9的不同卷积核卷积之后得到20*20*256的特征向量。卷积的作用是为了特征提取。

第二层是讲过9*9的卷积核步长为2。进行卷积,卷积后结果输入到32个胶囊里面,每个胶囊含有6*6*8个向量。

第三层是文章的核心是提出了动态路由的思想。32个低层胶囊向高层胶囊路由的过程。

低层胶囊到高层胶囊的路由过程,初始bij=0,ci=softmax(bij),cij是耦合系数,也可以成为低层胶囊i到高层胶囊j之间的概率。胶囊的输出是权重和,其中ui的表示为第一层胶囊层的输出向量,该函数压缩后成为Vj。对ci的更新,ci=ci+vj*ui。当vj和ui比较相似时候,点积是正相关,ci的值就会变大,当vj*ui的值小ci的值就更新的小。当迭代r轮之后。全部路由到DigitCaps层。

根据 Capsule 定义,它的长度表示其表征的内容出现的概率,所以做分类时取输出向量的 L2 范数就可以分类。

解码器可以实现分类功能。

                                                                                                 图2

解码器是讲DigitCaps胶囊中的向量解析为数字图像。这个过程能够证明胶囊网络有很强的鲁棒性。能看出模型存在的问题,解码的过程是全连接的过程,重构图像经历了3个全连接层。最后生成是784个维度。784=28*28是原图像的尺寸。

如何判断解码器重构的图像与输入图像的差距。可以用损失函数为重建图像与输入图像之间的欧氏距离。欧式距离越小,说明重建图像越接近输入图像越接近。

  • 胶囊网络的应用

Idea:研究生毕业设计是对锂电池褶皱进行检测。现在考虑,判断一个锂电池的健康状态,可以通过获取(电压,电流,电池容量)这几个值组成的矩阵,将其进行锂电池电池健康状态检测。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值