Time-Delay Neural Network(TDNN)-下

最新推荐文章于 2023-01-10 22:00:00 发布

wxb_blog

最新推荐文章于 2023-01-10 22:00:00 发布

阅读量3.9k

点赞数 2

分类专栏：算法文章标签： TDNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wxb1553725576/article/details/81674196

版权

算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

前言

本篇博客对TDNN网络结构的特性进行梳理，使读者了解设计所考虑的问题，关于其结构请参考博客Time-Delay Neural Network(TDNN)-上。博客基于对论文 Phoneme Recognition Using Time-Delay Neural Network 的阅读和理解，如有谬误，还望指出，不胜感激。

正文

语音识别的小伙伴都知道，语音识别通常要把一段不等场的语音切分成等长的小段，通常是每小段长度为25ms，然后以小段为单位进行处理，即只考虑当前帧。Time-Delay顾名思义即在时间上会有延迟，具体一点是指在识别的时候当前帧不仅考虑自身，还要参考一定数量的前后帧。
TDNN具有以下特性：
- 多层的feedforward NN及节点之间紧密的连接使得其可以表示复杂的非线性分类面；
- Time-Delay使得其可以学习到特征之间的时序依赖；
- 学习到的特征具有时移不变性，同一个音素出现在语音的不同位置学到的特征应该尽可能相近；
- 学习过程中特征和标签不需要精确地对齐；
- 参数数量应该远小于训练样本的数量；

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Time-Delay Neural Network(TDNN)-下

前言本篇博客对TDNN网络结构的特性进行梳理，使读者了解设计所考虑的问题，关于其结构请参考博客Time-Delay Neural Network(TDNN)-上。博客基于对论文 Phoneme Recognition Using Time-Delay Neural Network 的阅读和理解，如有谬误，还望指出，不胜感激。正文语音识别的小伙伴都知道，语音识别通常要把一段不等...
复制链接

扫一扫

专栏目录

wxb_blog CSDN认证博客专家 CSDN认证企业博客

码龄11年

189: 原创

9万+: 周排名

203万+: 总排名

45万+: 访问

: 等级

5969: 积分

106: 粉丝

109: 获赞

32: 评论

362: 收藏

私信

关注

热门文章

分类专栏

QT 16篇
STL 13篇
CPP 72篇
Java 12篇
MFC 3篇
ACM 105篇
C语言 15篇
Video 2篇
OPENCV 1篇
数据结构 10篇
高效程序员 2篇
错误代码 1篇
文件分类 1篇
计算机 35篇
算法 8篇
日记 4篇
GIS 1篇
Shell 8篇
博客 1篇
视频|图像处理 1篇
cambridge
CUDA_GPU编程 1篇
Kaldi 5篇
NEON 2篇

最新评论

C++之内置(内嵌、内联)函数
非线性光学元件: 既然c++的类的成员函数默认都是内联的，那为什么在其中可以使用循环语句呢
QSpacer用法简介
从程序员成功考公: 3年如果持续学习C++应该也能算一个大牛了吧。我从java转过来才2个多月。
QSpacer用法简介
科道: 一晃，三年过去了
QSpacer用法简介
从程序员成功考公: 你这话问的，让我怎么回答你，3年没回答你，我猜可能放弃学习C++了。
Crazy Tea Party
小朱爱数学也爱编程: 代码有点小问题 while(t--里面的输入cin>>N才对

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。