Time-Delay Neural Network(TDNN)-上

最新推荐文章于 2024-07-26 15:59:59 发布

wxb_blog

最新推荐文章于 2024-07-26 15:59:59 发布

阅读量8.7k

点赞数 2

分类专栏：计算机算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wxb1553725576/article/details/81588440

版权

计算机同时被 2 个专栏收录

35 篇文章

订阅专栏

8 篇文章

订阅专栏

前言

本篇博客仅对TDNN的网络结构进行简单梳理，使读者对TDNN的网络结构有一个清晰直观的印象。博客基于对论文 Phoneme Recognition Using Time-Delay Neural Network 的阅读和理解，如有谬误，还望指出，不胜感激。

正文

TDNN与1989年就已提出(在我出生之前)，用于音素识别。以下部分将以论文中的结构做简单说明，网络结构如下图：
这是一个只有4层(包含输入层)的TDNN，每一层的Time-Delay用N表示，单元数用J表示，将逐层介绍。
- 输入层：N=1(因为输入层特征是单帧提取的), J=16(Mel滤波的维度为16)，共15个frame；
- 第一隐层： N=2, J=8, 共13(15-2) frame, 参数量 8 x (2+1) * 16 = 384;
- 第二隐层： N=4, J=3, 共9(13-4) frame, 参数量 3 x (4+1) * 8 = 120;
- 输出层：N=8, J=3, 共1(9-8) frame, 参数量 3 x (8+1) * 3 = 81;
  总的参数量为384 + 120 + 81 = 585，相比现在网络动辄上百万的参数量，简直轻量到不能再轻量了。论文中提到，最后一层再时间维度上共享参数，如此输出层的参数量为 3 x 3 = 9，总的参数量更少。

参考

博客等级

码龄12年

189
原创

114
点赞

369
收藏

106
粉丝

关注

私信

热门文章

分类专栏

QT 16篇
STL 13篇
CPP 72篇
Java 12篇
MFC 3篇
ACM 105篇
C语言 15篇
Video 2篇
OPENCV 1篇
数据结构 10篇
高效程序员 2篇
错误代码 1篇
文件分类 1篇
计算机 35篇
算法 8篇
日记 4篇
GIS 1篇
Shell 8篇
博客 1篇
视频|图像处理 1篇
cambridge
CUDA_GPU编程 1篇
Kaldi 5篇
NEON 2篇

最新评论

Qt5中文乱码解决方法
laizixingxing567: 打开"aaa.txt"中文正常，但是ANSI格式的
Qt5中文乱码解决方法
laizixingxing567: 方法一亲试有效，谢谢！ QFile file("aaa.txt"); file.open (QFileDevice::WriteOnly); QTextStream stream(&file); stream<<"ABCD EFG"<<QStringLiteral("我是中文")<<8888888; file.close (); 打开"aaa.txt"中文正常了，QT5.14
C++之内置(内嵌、内联)函数
非线性光学元件: 既然c++的类的成员函数默认都是内联的，那为什么在其中可以使用循环语句呢
QSpacer用法简介
从程序员成功考公: 3年如果持续学习C++应该也能算一个大牛了吧。我从java转过来才2个多月。
QSpacer用法简介
科道: 一晃，三年过去了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。