Abstract:
谈谈我对Time-Normalization的理解
文献:
Sakoe H, Chiba S, Waibel A, et al. Dynamic programming algorithm optimization for spoken word recognition[J]. Readings in speech recognition, 1990, 159: 224.
1什么是time-normalization
通俗的来讲就是,讲时间的维度压缩到一个同一个标准之下,其实就是为了两个时间序列可以进行比较
2什么是DP
全称dynamic programming (DP) based time-normalization algorithm ,说白看就是,时间正则化的方法,也就是匹配算法,匹配好了 便是时间对应好了,也就是说和同一个标准对应上了
3如何求解
综上:目标是找到一条路径 让D最小、
4关于问题约束
一些基本约束
注意:这里的r是一个全局的约束
还有一个最重要的 Slope constraint condition:
简言之,就是当垂直或者水平方向走了 m步 之后,就必须斜着走n步,否则不能在原来的方向上继续走
根据上述约束 得到两个例子P=1,第二个例子中还额外附加了一个不允许走直角的条件
其他的类型
5关于权重W
权重的方法,有很多,它们共同的特点就是,尽量减少垂直或者是水平的方向运动。此外 它们的和最好是一个常数
这里有一种对称的和一种非对称的权重 设计方式,可以参考
示意图都在下面
最终关于DP的表达式