概述
计算机视觉主要是使用的深度学习,机器学习的方法来解决一些图像问题。由于输入进计算机的图像都是矩阵、数字的形式,于是我们需要通过一些方法让计算机识别这些图像,从而实现一些辅助效果。
基本入门分为CNN(卷积神经网络)主要是分类,包括(AlexNet,VGG,ResNet,DenseNet),
分割(UNet,FCN)
GAN(对抗生成网络),CAM和Grad-CAM(CNN可视化方法),注意力机制。
pytorch入门
莫烦python:https://morvanzhou.github.io/
卷积神经网络
这一部分需要了解基本的卷积层,池化层等基本概念就可以试着跑一跑CNN的网络了。(AlexNet,VGG,ResNet,DenseNet)这四种网络结构,尤其是residual block和dense block需要理解原理并且了解代码结构。
分割
先看FCN,再看UNet