李宏毅 - 卷积神经网络(CNN)
卷积神经网络主要用于图像分类。一张图片通过我们的卷积神经网络也就是Model计算出概率值,通过Cross entropy (交叉熵)归一化到0和1,概率最大的显示为1,其余显示为0。
那么一张图片是怎么输入到Model里面的呢?我们知道图片是一个三维的tensor(张量),张量可以理解为超过二维的矩阵。以下图举例我们可以写成(100,100,3)的形式,我们需要把这样的图片转化成一维的形式,也就是一个巨大的向量。这个巨大的向量才可以输入到我们的Model里。
Model怎么分辨图片里是什么动物呢?我们人是怎么分辨的,机器就是怎么分辨的。我们一般找图片的特征,比如:鸟嘴,眼睛,爪子等,机器也是这样的。我们深入思考一下,一张图片里的特征只占很小的部分,是不需要看整张图片的。这样处理起来,参数和计算量就少多了。