不知道哪位大神做得这张图,每每犯疑惑的时候都来看看这张图,瞬间又踏实了
这张图是一个典型的input channel =3,output channel=2的情况,其中对输入的图像又涉及到了pad=1的操作,pad的处理可以保留原始图像的所有信息,pad的数据一般都是为0操作。图中的计算是还有一个stride的概念,及每次步进的距离,图中是stride=1。
也可以用这张图的表示整个计算过程,主要是卷积核和输入图像的点乘然后进行累加操作,最后在进行不同input channel之间的一个累加操作。这才完成了CNN的计算过程。
给大家也推荐一篇博客,写的很好很细致。https://www.cnblogs.com/huangtao36/p/7818072.html,
有时间大家也可以看看,尤其适合初学的,对概念还有模糊的同学。因为本人是搞rtl的,也属于初学,先积累些知识,以便后面用FPGA实现CNN IP的整个计算过程。