计算机视觉是深度学习应用的比较成功的一个领域。卷积神经网络这种神经网络结构在计算机视觉很多方面的做得非常出色,比如图片分类、目标检测和图片风格转换。
1. 卷积
![7f7b538dd546288bcfb2f177623e1978.png](https://img-blog.csdnimg.cn/img_convert/7f7b538dd546288bcfb2f177623e1978.png)
上图比较清晰的反映出图片中的一个区域与一个卷积核进行卷积操作后得到的结果,我们将区域对应位置的值与卷积核对应位置的值进行相乘,最后将所有相乘后的结果累加,得到最终的结果。
那么卷积操作有什么意义呢?在吴恩达的deeplearning.ai课程上,通过一个例子来直观理解卷积操作的在边缘检测上的意义:
![1a3a6e288de6264b3cb5bc6986c5a66f.png](https://img-blog.csdnimg.cn/img_convert/1a3a6e288de6264b3cb5bc6986c5a66f.png)
如果我们要检测不同的边缘,我们可以采用不同的卷积核来进行卷积操作:
![c26c4d053f7f23c27cb0bd8de7cdd04c.png](https://img-blog.csdnimg.cn/img_convert/c26c4d053f7f23c27cb0bd8de7cdd04c.png)
卷积操作后得到的图片大小: