图像识别多维立体特征判断多个顺序结构场景

最新推荐文章于 2024-07-20 20:38:51 发布

飞快的小乌龟

最新推荐文章于 2024-07-20 20:38:51 发布

阅读量92

点赞数

文章标签：大数据

本文链接：https://blog.csdn.net/baidu_38890653/article/details/125620264

版权

提高图像识别的泛化性，以及避免欠拟合；多维立体特征判断多个顺序结构场景

前言：

本文不做深入探讨（因为目前只是了解一些概念），文中的一些思考也许很多方案已经成熟，也许一些想法是错误的，不作为技术说明和学习参考，仅作为深入学习前的一点思考。

曾经看到过这么一个短视频，主播在直播时，旁边空旷区域也显示了一个识别到人脸的选择框。使得直播心中恐惧万分... 类似的问题，偶有发生，说识别的不准确或者无法识别出人脸等。我们不考虑非自然因素的影响，从图像识别这项技术的一些技术要点中来一窥图像识别的奥义，仅在了解一些图像识别的基础概念后，思考下图像识别过程来找到一些影响图像识别精确性的因素，考虑如何改善它。

以CNN为例，图像经过预处理-》卷积层-》池化层-》输出层。将输出图像识别的结果。当然在此之前，已经有了训练好的图像分类器。而识别的过程就是对比图像特征的匹配度，以高于一定阈值时作为匹配成功，并给出确信度。

这里不去细究训练过程与识别过程的细则，仅抓住一个要点：训练过程是找到图像的共性特征并记住它，识别是找出图像的特征并尝试匹配它。其中第二步的找出特征工作应该与第一步的特征提取选用了相同的提取方式和处理方式。因此较为关键的一点就是共性特征的提取。

这里举一个不太恰当的例子，在训练人脸识别时，给出的全部是带刘海的女性同志（假设刘海的特征被提取并占据很大权重），那么极有可能出现男性同志无法被识别（属于不完全意义上的过拟合），亦或者仅是一个梳了中分的泰迪就被识别成了脸（属于不完全意义上的欠拟合）。

再举一个例子，若训练过程中特征识别的处理方式为图像整体梯度变化均值，起伏的山坡（先升后降）和平坦的土地（一直为平）则也会识别为相同特征的分类。

换言之，若特征提取的种类和处理方式不合适，则就有可能产生异常场景的识别问题。使用通用的学习框架，框架中则要包含较多的特征提取方式，以避免出现无效特征的误取以及有效特征的丢失，或者利用先天的经验来给与一些前置处理，和特征指定。

鉴于以上思考，得出一些图像处理等机器学习中应当注意和考虑的特征判断依据。

1.多维度。（取多个特征，来避免特征误匹配的欠拟合问题以及特征权重过大导致的过拟合）

2.有顺序。（输出特征之间的相关性，来避免假匹配的欠拟合问题）

3.结构化。（类顺序性，特征之间的因果性，多层网络输入输出的影响，也是减少欠拟合问题）

4.有场景。（结合场景特征/背景特征，进一步减少欠拟合问题）

飞快的小乌龟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
图像识别多维立体特征判断多个顺序结构场景

这里举一个不太恰当的例子，在训练人脸识别时，给出的全部是带刘海的女性同志（假设刘海的特征被提取并占据很大权重），那么极有可能出现男性同志无法被识别（属于不完全意义上的过拟合），亦或者仅是一个梳了中分的泰迪就被识别成了脸（属于不完全意义上的欠拟合）。因此较为关键的一点就是共性特征的提取。使用通用的学习框架，框架中则要包含较多的特征提取方式，以避免出现无效特征的误取以及有效特征的丢失，或者利用先天的经验来给与一些前置处理，和特征指定。（类顺序性，特征之间的因果性，多层网络输入输出的影响，也是减少欠拟合问题）
复制链接

扫一扫