CNN
CNN最重要的概念就是卷积核(Convolution Kernel),也就是名字中的“C”的由来。这个卷积核的作用就是用于识别图片中的”特征“,从而完成特征提取。通常一个CNN网络会有多个特征提取器(一个特征对映一个卷积核),用于提取图片中不同的特征。举个不太恰当但很易于理解的例子,在人脸识别的时候,人类大概可以根据对方的眼睛、鼻子、嘴巴来判断对方的身份,那么在一张人脸上,“眼睛”、“鼻子”、“嘴巴”就可以作为一个人脸的“特征”。同样,在一张图片传入到CNN框架中的时候,CNN网络中就可以定义3个卷积核,每一个卷积核对映去提取一张的人脸中“鼻子”、“眼睛”、“嘴巴”这些特征。但是一张人脸图片是很大的,鼻子、眼睛只是占整个图片中的一部分,我们需要判断鼻子在整个图片中所占的位置,这个时候就需要引入“滑动窗口”的概念了,即负责识别“鼻子特征”的卷积核可以理解为一个鼻子大小的小方格,这个方格会在整个人脸图片中依次滑动,从而找出人脸图片中“鼻子”特征所在的区域。当3个卷积核分别提取完了人脸图像中“眼睛”、“鼻子”、“嘴巴”的特征之后,综合分析这三个特征的值,最终就能判断这张脸是谁的脸了。从上面可以看出,CNN中最重要的概念就是“卷积核”的概念,这也是为什么说CNN具有很好的“特征提取”的能力。
RNN
RNN中最鲜明的特性是其具有“记忆力”,能够记住先前已经发生过的事情。这里我们举一个自然语言处理中RNN应用的一个例子,比如说,我们现在要让机器分析“你好厉害哦!”这一句话的情感,乍眼一看这句话是在做夸奖,夸一个人很厉害,但如果在这句话之前再加一句话,“听说你昨晚开黑中单0-16?你好厉害哦!”,这就明显是一句嘲讽技术的话