极简笔记：Dynamic Routing Between Capsule

最新推荐文章于 2020-09-14 22:27:57 发布

Hibercraft

最新推荐文章于 2020-09-14 22:27:57 发布

阅读量539

点赞数

分类专栏：极简笔记文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hibercraft/article/details/78635051

版权

极简笔记专栏收录该内容

37 篇文章 2 订阅

订阅专栏

极简笔记：Dynamic Routing Between Capsule

capsule第一弹，算是capsule的一个简单demo，为了证明capsule是能用的。

如果传统神经网络神经元是标量神经元，capsule可以理解成张量神经元(2 dim of spatial & 1 dim of feature vector). vector length是对象出现概率，orientation是对象属性。

在mnist上使用三层结构测试：
image–conv1–PrimaryCaps–DigitCaps

前两层之间都是正常卷积，PrimaryCaps相当于把卷积层打包分组成capsule（计算本质和卷积一模一样，只是分了个组而已），Primary-digit是先每个capsule中的向量（6*6*32个,8-dim）到10个16-dim输出向量做全连接，每条边的权重是矩阵 $W_{ij}$ （size: 8*16）得到 $\hat{u}_{ij}$ （6*6*32*10个), 然后加权求和并对10个向量 $s_j$ 的长度做非线性归一化成输出向量 $v_j$ ，其中加的权 $c_{ij}$ 是真正dynamic routing方式更新的部分， $c_{ij} = exp(b_{ij}) / \sum_k exp(b_{ik})$ ，也就是softmax操作，同时更新 $b_{ij} = b_{ij} + \hat{u}_{ij}^T v_j$

因为dynamic routing这部分参数比全连接还要多一点点（多的就是那几个c），所以肯定还要改进。

都全连接了再突出affine transformation robust就没啥必要了，但值得注意的是，把最后得到的10个 $v_j$ 经过三层全连接重构成原图，把这个误差加上训练能一定程度地提高准确率（好的特征表示要有很强的重构能力！！！）

论文地址：https://arxiv.org/abs/1710.09829

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
极简笔记：Dynamic Routing Between Capsule

极简笔记：Dynamic Routing Between Capsule
复制链接

扫一扫

专栏目录

Hibercraft CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

9万+: 周排名

119万+: 总排名

13万+: 访问

: 等级

1685: 积分

77: 粉丝

40: 获赞

22: 评论

160: 收藏

私信

关注

热门文章

分类专栏

极简笔记 37篇

最新评论

极简笔记 The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-un
溯水襄陵_: 不懂这个loss到底是啥意思，不过代码写得还挺清楚，能直接用
极简笔记 Meta-Learning for semi-supervised few-shot classification
weixin_42720165: 你好，我想问一下，对于soft k-means + cluster的方法，对于所有的未标记样本，是直接把它归到N+1类中吗？
【极简笔记】Tunneling Neural Perception and Logic Reasoning through Abductive Learning
麦香猪扒饭: 您好，我想请教一个事情。当传入的数据是一致的时候，他会推导出算术规则如何加入KB中参与下一次的consistency判断吗？比如我识别出1+1=1，一致，那么abductive会推导出op(1, 1, 1)，这个op(1,1,1)会加入KB中并参与下一次consistency的判断吗？我觉得他是有加进去的，因为他的prolog里面是不包含operation rules的。但是如果是加进去了，如果是错误的怎么办，比如1111111可以识别成11+11=11，也可以识别成111+1=11，那么问题来了，当我识别成11+11=11是错误的，但是又满足一致性，于是我有operation rules op(11,11,11)，那如果是这样他又要怎么调整？我觉得他这个有点不太对劲。求解答，谢谢楼主了
极简笔记 Meta-Learning for semi-supervised few-shot classification
jinghanSun: 感谢分享！作者在实验部分给出了5-shot和20-shot的结果，作者说如果是5-way 5-shot的话只需要25个label，这是为什么啊？如果一个类别里有5张图片，那么就需要这五张图片的label啊，如果有很多个task，那么就需要n_task*25个label啊
极简笔记 Pyramid Attention Network for Semantic Segmentation
qq_40548768: 楼主，请问这种前后不一致的现象（论文和开源的代码不一致），我该相信那个，两种实验的结果都不太好

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。