分类任务:主要是介绍了计算机视觉在场景中的实际应用,以及对于物体的分类、检测、分割。
通过对物体的特征进行分类。
算法框架:MMDetection:目标检测、实例分割、全景分割(航拍)
MMDetection3D: 航拍 路面检测
MMClassification:根据图片物体特征进行分类,并判断准确率百分比
MMSegmentation:无人驾驶 遥感
MMPose & MMHuman3D:人脸 动作捕获
MMTracking:目标追踪
MMAction2:行为识别 动作捕捉
MMOCR:文本检测 识别 文字信息提取
MMEditing:图像修复 分辨率 图像生成
机器学习基本流程 :训练->验证->应用
过拟合:数据模型过于复杂 数据量不足
欠拟合:没有捕捉到模型规律 模型过于简单
拟合:可以准确预测到未来的数据
卷积神经网络:
卷积层:边缘填充(padding)步长(stride)空洞(dilation)
池化层:下采样,最大池化(卷积特征最大值),平均池化(卷积特征【加和求平均】)
全连接层:拉平,合并输出
输出层:网络输出转化成概率值,每个类别的概率值