通用视觉框架 OpenMMLab(第一课)
子豪兄熟悉的声线~~~
1.环境配置
实不相瞒,MMLab环境配置是真的难,各种报错,有时在linux还存在库版本不对的情况,好在都能解决。环境配置链接在此。
2.课程内容
本节课是一些基础知识内容,一直在听,课后看的笔记。对最后前沿发展方向充满兴趣。
每一个都是值得深入研究的方向,可以出很多成果,无敌~
3.正文
3.1 计算机视觉是什么
计算机视觉是一门让计算机学会 "看"的学科,研究如何自动理解图像和视频中的内容。比如:微信 扫一扫 识物、人脸识别。
计算机视觉的应用包括动漫特效。
航拍转地图
### 3.2 计算机视觉的发展
1.统计机器学习与模式识别 (1990~2000)
2.视觉特征
3.大型数据库(ImageNet)
4.初有成效的视觉系统(~2010)
5.深度学习时代(2012~)
3.3 MMLab
总体架构概览。包括MMClassification、MMDetection、MMDetection3D、MMRotate、MMSegmentation、MMPose、MMAction2、MMOCR、MMEditing、MMGeneration、MMFlow、MMTracking、MMHuman3D、MMFewshot,等等。
算法训练模型部署一体化
3.4机器学习基础
从数据中学习经验,以解决特定问题。比如,机器翻译、人脸识别、语音识别、强化学习。
机器学习典型范式:
and so on~