计算机视觉是一门让计算机学会 "看"的学科,研究如何自动理解图像和视频中的内容。在日常生活中,像微信扫一扫识物、相机识别人脸并框选、人物智能相册、抖音特效等均有涉及。另外汽车雷达监测、地图软件中的3D地图、虚拟主播(人脸关键点识别,体现在动漫形象)、视频理解与自动剪辑中有AI审核、视频高能片段标记、特定特征提取等。这里举一个例子:检测到人脸微笑自动开枪,俗称“笑死”。
MMDetection:全景分割,就是将背景也加入进去,多用于无人驾驶
MMtracting:逐帧处理,可用于蜜蜂追踪、手部关节、人脸三维、AI健身(深蹲、引体向上);
机器学习基本流程:采集数据训练→验证精度→实际应用
机器学习是什么?答:从数据中学习经验,以解决特定问题。统计学习问题
测试集好比高考,只有一次机会。
池化层可以降低分辨率。
二维一张纸,三维一本书,四维一个书柜。
此外,对于一些名词诸如分类器、神经元、感知器等涉及数学方面的解释未理解,课下学一下。