DATAWHALE-李宏毅机器学习-6

樟宜

于 2022-09-24 19:51:52 发布

阅读量120

点赞数

本文链接：https://blog.csdn.net/ruthzhang1018/article/details/127007324

版权

CNN (Convolutional Neutral Network)

每一个nerual相当于一个最简单的分类器。
利用CNN做图像识别：

许多很小的pattern 要远小于整张图片，不需要看整张图片来确定某个pattern。(convolution来处理)
同样的pattern出现在不同图片的不同位置。(convolution来处理)
图片十个亿做subsampling（比如说把一张图片奇数行、偶数列的像素拿到不影响认识图片）【max pooling 来处理】
image $\rightarrow$ convolution $\rightarrow$ max pooling $\rightarrow$ max pooling （反复几次是自己设计的） $\rightarrow$ flatten $\rightarrow$ fully connected feedforward network
filter 就相当于是fully connected feed forward network中的neural，filter 是一个matrix，里面的数值(parameters)是需要学习去确定的。经过convolution的图片的矩阵会变小（更少的参数），并且经过filter变成了立方矩阵。【shared weights】
colorful image 中每张图片是一个立方体的形式来表示，当然filter的matrix也是立方的。“立方的矩阵怎么相乘”
max pooling 选每次尽心完filter后再分块后的最大的
66 - 22 深度依靠于filter 决定
What does CNN learn？
$x^*= arg \mathop{max}\limits_{x}a^k$
$a^k = \sum_{i=1}^{11}\sum_{j=1}^{11} a_{ij}^k$
想知道第k个filter的作用，要找一张image，这张image它可以让第k个filter被active的程度最大。 [gradient ascent] 会找出来每一个filter实际上是找到了某种纹路在不断重复的图
那么现在使得已知输出最大可能性的数字，想要反向去找一张imagine，就 $x^*= arg \mathop{max}\limits_{x}y^i$
想要让图像变得更像数字 $x^*= arg \mathop{max}\limits_{x}(y^i-\sum_{i,j}|x_{i,j}|)$