就拿这张图来说,我们人眼能看到这张图中有很多的东西,人,减速带,车等等。
但是机器只能看到一堆的数字,这堆数字代表什么人不知道,但是机器可以学习得到。
图像输入到电脑中的是一个数字矩阵
上图所示,最左边的三个代表的是图像的三个通道(RGB),这样就会有代码conv2d(3,out_channels,3*3)
但是这个out_channels
为什么不是三,不和原来的一样,要逐渐增多。就是因为,人一眼看上去能够知道这张图像中都有什么,但是电脑却不行,通道增加就代表增加很多的特征图,比如增加到256,256
个通道输出256张特征,这256张特征当中又重复的也有不重复的,他们就可能代表的是,车,人,减速带等等。
神经网络
是模拟人类的神经模式构建的模型,是希望电脑能象人一样思考学习,所以,有啥想不通的,就想想自己大脑是增么工作的。
激活函数
为什么加激活函数,这就是相当于大脑里的多巴胺一样,这样想就能想得明白了。