DSN，W-DSN文献资料整理

最新推荐文章于 2024-07-19 16:50:04 发布

StrugglerNeu

最新推荐文章于 2024-07-19 16:50:04 发布

阅读量1.1k

点赞数 1

文章标签：人工智能神经网络

本文链接：https://blog.csdn.net/weixin_56593260/article/details/122662817

版权

Wishart Deep Stacking Network(W-DSN)资料

Deep Stacking Network （DSN）

深度堆叠网络(DSN)是一种具有并行性(parallel)和可塑性(scalable)学习的网络，它相比于其他网络的优点在于学习的简单性，因为他不需要随机梯度下降算法，而这种算法要实现并行性几乎是不可能的。[1] 他的应用包括语音识别，图像识别以及信息检索等领域。

DSN的架构最初源自于微软研究中心的Li Deng 和 Dong Yu，他们在2011提出了DCN（Deep Convex Net）网络[2]（注;此处的DCN网络的架构就是后期DSN网络架构，只是作者将其命名为DCN网络，而后来研究者认为DCN网络中的堆栈架构，故起名为DSN网络）。该网络的架构总结如下图1所示，

图 1 DCN架构总结

原文中给出的网络架构如下图2所示，图中给出了一个多层的DCN架构中的两层示意图，其中MODULE1为最底层，MODULE2为非最底层。右图图是另外一篇文献中给出的DSN网络的架构，两者表达相同含义。

DCN中非最底层模块内的数据流动如下图3所示，图中参数U为模块与输出层的权重参数，W为隐藏层与输入层的参数权重，H是隐藏层输出的向量，T是目标分类的向量。

图 2

由于DCN算法的权重定义在每个模块内，而不是全局的，并且是也没一批模块为基础的，故显然DCN算法具有良好的并行性。（原文：the “fine tuning” algorithm of DCN weights we developed recently is confined within each module, rather than across all layers globally. It is batch-mode based, rather than stochastic; hence it is naturally parallelizable）

Sparse Deep Stacking Network（SDSN）

稀疏编码可以更高阶表示图像的分类，并对噪音表示具有有良好的鲁棒性（good robust representation to noise）。SDSN的架构是DSN架构的稀疏表示，并且堆叠操作与DSN架构相同。SDSN与DSN的差异主要存在两部分[3]

考虑了除了sigmoid激活函数之外的激活函数
在隐含层单元中添加了稀疏性惩罚

其优化目标变成如下图4所示

图 4

由于结构的简单性，SDSN仍然具有DSN中参数的可塑性和计算能力并行性的优势。

Wishart Deep Stacking Network (WDSN )

Wishart分布可以用来制造随机对称矩阵。随机对称矩阵的一个重要性质就是正定性(positive definiteness)。虽然有很多方法来实现随机对称矩阵，Wishart分布是最常用的方法，因为Wishart分布有非常好的分析性质和与多元正态分布的关系。

在参考文献4中[4]，作者将WDSN应用于POLSAR图像的分类，（POSLAR全名为polarimetric synthetic aperture radar，在军事，农业以及地理中应用十分广泛，类似于卫星拍摄的图片）。文章中作者实现的步骤如下：

利用Wishart距离将POSLAR图像信息转换为网络信息
由于Wishart距离计算上的复杂性，故进行线性化，减少计算量
定义Wishart Network（WN），建立数学表达式可以优化网络中参数（权重矩阵以及偏置项等），进而提高分类正确率。（见原文第四页具体数学表达式）
进行监督学习训练参数
如果准确率不足，可以扩展WN，具体做法增加隐藏层中单元的个数

WDSN与DSN的唯一区别在于堆叠的是WN网络。

参考文献

[1] Deng L, He X, Gao J. Deep stacking networks for information retrieval[C]//2013 IEEE International Conference on Acoustics, Speech and Signal Processing. IEEE, 2013: 3153-3157.

[2] Deng L, Yu D. Deep convex net: A scalable architecture for speech pattern classification[C]//Twelfth annual conference of the international speech communication association. 2011.

[3] Li J, Chang H, Yang J. Sparse deep stacking network for image classification[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2015, 29(1).

[4] Jiao L, Liu F. Wishart deep stacking network for fast POLSAR image classification[J]. IEEE Transactions on Image Processing, 2016, 25(7): 3273-3286.