TDNN网络

一只特立独行的猪！！

已于 2024-09-08 16:26:32 修改

阅读量186

点赞数 1

文章标签： python 语音识别

于 2024-09-08 16:14:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61529113/article/details/142028583

版权

TDNN代码

核心思想是将语音的提取特征的帧进行前后联系，展开

举例：
1，2，3，4，5

123，234，345

进行了扩展，使得网络看到的特征范围更广

import torch.nn as nn
import torch.nn.function as F

class TDNN(nn.Moudle):

    def __init__(
                    self,
                    input_dim,
                    output_dim,
                    context_size,
                    stride,
                    dilation,
                    batch_norm,
                    dropout            
                ):
        super(TDNN, self).__init__()
        self.input_dim = input_dim
        self.output_dim = output_dim
        self.context_size = context_size
        self.stride = stride
        self.dilation = dilation
        self.batch_norm = batch_norm
        self.dropout = dropout

        self.kernel = nn.Linear(input_dim * context_size, output_dim)
        self.nonlinearity = nn.ReLU()
        if self.batch_norm:
            self.bn = nn.BatchNorm1d(output_dim)
        if self.dropout_p:
            self.dropout = nn.Dropout(p = self.dropout)
    
    def forward(self, x):
        _, _, d = x.shape
        x = x.unsqueeze(1)

        # 将前后几帧都联系起来，已当前帧为中心，扩展到周围
        x = F.unfold(
                    x,
                    (self.context_size, self.input_dim),
                    stride = (1, self.input_dim),
                    dilation = (self.dilation, 1)
                    ) 

        x = x.tranpose(1, 2)
        x = self.kernel(x.float())
        x = self.nonlinearity(x)

        if self.dropout_p:
            x = self.dropout(x)
        
        if self.batch_norm:
            x = x.transpose(1, 2)
            x = self.bn(x)
            x = x.transpose(1, 2)
        
        return x

关于unfold函数的理解

http://t.csdnimg.cn/HAe40

http://t.csdnimg.cn/2wuke

关于transpose函数的理解

http://t.csdnimg.cn/C8Xd6

一只特立独行的猪！！

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

一只特立独行的猪！！ CSDN认证博客专家 CSDN认证企业博客

码龄3年

9: 原创

38万+: 周排名

11万+: 总排名

1628: 访问

: 等级

119: 积分

17: 粉丝

29: 获赞

3: 评论

20: 收藏

私信

关注

热门文章

分类专栏

最新评论

1. 两数之和
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
DataLab
CSDN-Ada助手: 恭喜您在博客世界的持续创作！标题“DataLab”引人入胜，让我迫不及待地想要阅读您的第三篇博文。您的专注于数据实验室的主题给人一种深入研究和探索的感觉，非常令人兴奋。在下一步的创作中，我希望能看到更多关于数据实验室的详细介绍和应用案例。您可以分享一些实际问题中如何利用数据实验室来解决挑战的经验，或者探讨一些新的技术和方法在数据实验室领域的应用。这样的内容将让读者更好地理解数据实验室的价值和潜力。再次恭喜您的努力和成果，期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
【无标题】Clion基础设置
CSDN-Ada助手: 这篇博文谈到了Clion基础设置，非常实用！非常鼓励你持续创作，分享更多关于Clion的技巧和经验。除了基础设置，你可以探索一些其他Clion的高级功能，比如调试器的使用和自定义快捷键的设置。此外，你还可以分享一些与Clion相关的插件推荐和代码重构技巧，这些内容对读者来说也会非常有价值。谢谢你的分享！期待更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Clion新建工程文件
CSDN-Ada助手: 恭喜您开始博客创作！标题“Clion新建工程文件”听起来很有意思。我觉得您可以进一步介绍一下Clion的基本功能和特点，以及在实际使用中可能遇到的一些问题和解决方案。期待能看到更多关于Clion的内容。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。