第一节课基本就是简单了解和介绍基本情况,所以自然的笔记就不会太难,那我们马上开始吧。
一、简单背景介绍
首先了解了计算机视觉是什么,其实我们生活中都随处可见,如我们几乎每天都要使用的微信扫一扫等,通俗点说,就是要让计算机像人一样学会“看”。现在比较多的应用于:风格转换、图像生成、视频理解等等。
随着深度学习、计算机视觉等学科的发展,各大研究机构和公司陆续开源自己的深度学习框架,比如我们常用的TensorFlow、Pytorch等,发展趋势大概是统一的深度学习框架逐步演变到统一的算法框架和生态。
二、OpenMMLab总体现状
就是一句话,能用到的这都有
·Architecture 提供统一先进的底层架构
·Research Areas 覆盖计算机视觉众多方向
·Algorithms 提供最经典、最前沿的算法支持
·Pretrained Models 提供统一的基准和开箱即用的工作
算法框架介绍
MMDetection: 包括目标检测,实例分割,全景分割
MMDetection3D:3D目标检测,前者的加强版
MMClassification:有丰富模型库的分类模型
MMSegmentation:语义分割模型,包括无人驾驶、遥感、医疗影像分析等
MMPose & MMHuman3D:利用关键点检测全身、人脸/手动作
MMTracking:视频目标检测,有单目标跟踪和多目标跟踪
MMAction2:行为识别、时序动作检测、时空动作检测
MMOCR:文本处理的框架,可以文本检测、识别、关键信息提取等
MMEditing:图像处理的框架,包含图像修复、抠图、超分辨率、图像生成等
三、机器学习和神经网络
这一部分包含:
实话讲这一部分内容,无论是PPT或者是西瓜书花书,总结的都会比我到位,已经大四老学姐了,这一部分就不多赘述。
这里点几块里面需要重点注意的吧,机器学习基础这块必须认真啃下来;其他的分类、回归问题可以在遇到具体例子时候总结积累;至于模型训练部分我认为也是比较靠实战积累的;卷积神经网络模型在深度学习里也是一个需要重点关注、认真学习的部分,效率高、结果好;至于Pytorch环境配置和基础使用这块,得上手实操,具体讲很难不干。