基于dtw的在线识别及其与通用模式识别的区别

最新推荐文章于 2023-11-25 18:09:30 发布

csdn_kike

最新推荐文章于 2023-11-25 18:09:30 发布

阅读量576

点赞数

分类专栏：图像处理模式识别

本文链接：https://blog.csdn.net/csdn_kike/article/details/79573587

版权

图像处理同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

模式识别

4 篇文章 0 订阅

订阅专栏

做过基于dtw的模板匹配项目，其中用于dtw匹配的方向矢量的概念也是将平面分成若干份，计算采样曲线前后两点的相对方向特征的：

如图，平面按照顺时针方向均分成8个区间。假设手写字符c，则应是从右上开始画半圆，在手写过程中进行数据采样，得到右边的圆点序列。则从第2点开始，每点相对于前一点都可以按照左图的方式给每条线段进行方向矢量编码，从而得到在线书写的字符的方向矢量序列，可以用来作为dtw匹配的特征序列之一。

dtw匹配方式也可称为弹性匹配，对于语音及手写字符的识别来讲，这是一种最符合直觉的匹配方式，因为输入和模板存在相当程度上的相似性，但又绝对不相同，弹性匹配是一种很好的选择。但是，用于字符识别的时候，它是有局限性的。首先dtw只适用于在线识别，即抓取的数据点是有时间上的顺序的，比如图中的c，先写右上的点，再往下往左然后往下往右，采样的数据是这么排列的。假如逆序写c，则与固定的顺序写c的结果是无法匹配成功的。

模式识别的方式通常是，直接得到一个图片，进行预处理，然后从左上到右下进行分块，计算每个小块的像素密度特征，然后一行一行的特征串成一个一维序列，对比其与模板的差距。这里不需要管字符是顺着写还是逆着写，总之只要最后的图像和模板一个样，那就一定能识别。

二者的应用范围应该是不同的，dtw主要用于语音和在线签名鉴定等方向，语音天生是有时间特征的，签名鉴定需要保证不是有人像描图一样把名字写出来，而是考虑了书写的习惯，比如先写横后写竖等不同的个体习惯差异；而模式识别里通用的匹配则是面对的静态图片，它不管你怎么写，哪怕像打印机一样一行行的喷墨最后形成一个字符，仍然可以识别。

忘了在哪里看到的一些文章，要匹配某些曲线（可能闭合，似乎是地图，海岸线或者文物碎片等），但是可能又不能确定正方向（输入和模板可能旋转了一定的角度），所以不能直接用静态图像匹配的方式来实现，只记得作者采用了某些策略从某个地方将曲线断开，然后应用了freeman 链码之类的方式得到整条曲线的特征序列，这个就很像这里的方向矢量特征了。由此可见，只要想，还是可以找到乘隙而入的机会的。