DPTNet的学习

最新推荐文章于 2024-05-20 11:26:19 发布

HaiderZhong

最新推荐文章于 2024-05-20 11:26:19 发布

阅读量1.3k

点赞数 2

文章标签：神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48186491/article/details/120680185

版权

DPTNet和Sepformer原理是十分相似的，关键在于

1.两者在Decoder有区别，

2.中间的主要的Sepformer中的transformer构造不同。

整体：

由于都是借鉴的是DPRNN的数据处理过程，都是Encoder+Separation+Decoder。

Encoder：

先通过一维卷积，再激活一下。

Decoder：

基于TasNet，也就是mask方法，所以运用混合声源与mask网络相乘，然后用线性层网络Linear分析出有多少个声源，最后重叠相加，（这是代码的表现）

正常来说，应该是用转置卷积层，处理每一个层，然后用mask相乘，得到单个声源的信号。

分离网络：

先分块，然后LN归一化，放入两个改进过的transformer中：（如下）

然后就是最难解释的地方了：

这里overlap-add后的两个结果再经过一维卷积有什么用呢?得到了两个值，相乘后再激活，就是mask掩码？

看代码的话，感觉知道他怎么做的，但是不知道这样做为什么？

反正看代码，感觉比看论文好一些。

对于分割块部分的操作：

分两个步骤，没有单独的代码，放到卷积层里面，捎带着就给分离出来了

1.先把[N*L]在中间加入一个维度的信息，变成[N,1,L]。

2.然后通过卷积层，定义相应的参数（主要是卷积通道和步长之类的），把1——>2P，把L——>S。

下面是我对于代码里面的解释：

mixture_w=F.relu(self.conv1d_U(mixture))#[B,N,L]

DPTNet也是经过分割的，然后得出是[B,N,L]

代码里面的图解里面的

B N

N 2P

L S

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
3
评论
DPTNet的学习

DPTNet和Sepformer原理是十分相似的，关键在于1.两者在Decoder有区别，2.中间的主要的Sepformer中的transformer构造不同。整体：由于都是借鉴的是DPRNN的数据处理过程，都是Encoder+Separation+Decoder。Encoder：先通过一维卷积，再激活一下。Decoder：基于TasNet，也就是mask方法，所以运用混合声源与mask网络相乘，然后用线性层网络Linear分析出有多少个声源，最后重叠相加
复制链接

扫一扫

HaiderZhong CSDN认证博客专家 CSDN认证企业博客

码龄4年

29: 原创

23万+: 周排名

172万+: 总排名

2万+: 访问

: 等级

332: 积分

1569: 粉丝

18: 获赞

6: 评论

96: 收藏

私信

关注

热门文章

最新评论

DPTNet的学习
夜曲2021_: 至于DPTnet和sepformer的区别，sepformer中给了描述： An attempt to integrate transformers into the speech separation pipeline has been recently done in [22] where the proposed Dual-Path Transformer Network (DPTNet) is shown to outperform the standard DPRNN. Such an architecture, however, still embeds an RNN, effectively negating the parallelization capability of pure-attention models.
DPTNet的学习
夜曲2021_: overlap-add后的操作是门控机制，可以参考LuoYi的Tasnet中的Encoder获取特征表示时的操作，此门控机制参考的论文是Language modeling with gated convolutional networks
试题算法训练自行车停放
我爱派生: 好厉害呀几年还参加吗
野人传教士问题A*算法+GUI
qq_52536106: 博主你好，我运行的时候怎么报了一个0不能做除数的错？
DPTNet的学习
宅羽花花❀: B是batch吧，N还是N，L是一维卷积和激活后的

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。