【Mark一下】行人重识别、模式识别、矩阵分解

最新推荐文章于 2023-12-31 01:10:42 发布

千想

最新推荐文章于 2023-12-31 01:10:42 发布

阅读量398

点赞数 1

文章标签：语音识别深度学习机器学习

本文链接：https://blog.csdn.net/Qsinsong/article/details/120252144

版权

本文探讨了有遮挡的行人识别问题，引入矩阵分解的概念，特别是子空间、稀疏表示和奇异值分解，以解决图像中遮挡部分的影响。模式识别通过数学技术处理和判读样本，而低秩矩阵分解可以用于图像降维，可能有助于在有遮挡的情况下提高识别精度。尽管目前效果有限，但低秩矩阵分解可能是解决这一问题的一个方向。

摘要由CSDN通过智能技术生成

0 引言

临时想到一个问题Mark一下供参考，
对于有遮挡的行人或者物体识别，或者泛化为不全的模式识别问题。
是否可以从矩阵计算的角度，引入某个矩阵分解方式去把整个图片分成：
没被遮挡的公共的在多个图片中一致的landmark 因子和体现在不同图片中的无规律的遮挡因子。
凭我的经验感觉可以去了解一下subspace，稀疏表示以及矩阵分解等知识，也许可以做一些思考和尝试。
有想法了可以找我讨论。

前三节是学习和复习记录，第四节的其他发现感觉有用，最后的思考和总结放在结束语部分。

1 模式识别

首先，看看百科上的定义

模式识别（Pattern recognition），就是通过计算机用数学技术方法来研究模式的自动处理和判读。

或者用更直白的一个定义

所谓模式识别的问题就是用计算的方法根据样本的特征将样本划分到一定的类别中去。

用人话讲，就是人制定出一些规则输入给电脑，电脑应用规则去处理和操作信息，从而能够描述、辨认、分类或者解释某些信息。
而模式识别中的模式就可以理解为一种抽象信息，例如语音识别里的声音的波形图等。而如果需要识别的东西一开始没有什么确定的信息，那就要通过数学建模等方式抽象出一些信息以使机器有能力执行和完成识别任务。

2 有遮挡的行人或物体识别

其实主要的课题是行人重识别，就是在图像或监控视频中重新找到我想找到的一个人。这个任务其实不算难，也是通过深度学习来提取特征再分类特征信息从而找人。
而老师语义中的麻烦之处就是“有遮挡”三个字。对于原本的这个问题，师兄和老师的解决之道大概是把人分成几个主要部分，比如说头、身子、手臂、双腿和脚，然后每一部分单独提取特征并与其他图像的这一部分去进行比对。所以在遇到遮挡问题的时候，就可以不比较遮挡部分的信息，只分析和比较其他部分的信息，以达到不被遮挡部分的像素影响总体找人精确度的目的。

3 矩阵计算及分解

3.1 子空间（Subspace）

子空间指的是维度小于全空间的部分空间。

举个例子来说明的就是，我所在的房间内部是一个空间，或者我把它定义成最大的空间（全空间）；那么，桌面所在的这个面上的空间，就是一个子空间。
子空间也需要满足封闭性，也就是桌面上的一个向量加另一个向量得到的还在这个桌面之上。

3.2 稀疏表示（Sparse Representations）

稀疏表示是用较少的基本信号的线性组合来表达大部分或者全部的原始信号。

很好理解。用个不恰当的比喻来说明就是，一套《冰与火之歌》有超级多的字儿，但其是由26个英文字母和空格标点什么的组成的。在图像领域的话就是，一个图片数据集（包含各种动物）作为一个字典，那么用尽量少的图片去表示人类，这个过程就可以理解为是一个稀疏表示。
在数学上表示[1]就是， $\arg \min \left\|Y_{i}-D \times X_{i}\right\|_{2}^{2} \quad \text { s.t. }\left\|X_{i}\right\|_{0}<T$

最低0.47元/天解锁文章

千想

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Mark一下】行人重识别、模式识别、矩阵分解

目录0 引言1 模式识别2 有遮挡的行人或物体识别3 矩阵计算及分解3.1 子空间（Subspace）3.2 稀疏表示（Sparse Representations）3.2 矩阵分解（Matrix Decomposition）4 结束语参考文献：0 引言我昨晚在溜达北京城的时候，老师突然发过来一条微信：千想，临时想到一个问题Mark一下供参考，对于有遮挡的行人或者物体识别，或者泛化为不全的模式识别问题。是否可以从矩阵计算的角度，引入某个矩阵分解方式去把整个图片分成：没被遮挡的公共的在多个图片中
复制链接

扫一扫