CNN非常适合具有空间结构的数据。具有空间结构的数据类型的示例有声音、图像、视频和文本。在自然语言处理中,CNN用于各种任务,如句子分类。一个例子是情感分类的任务,其中句子被分类为属于预定的类别组。
面部识别
大多数社交网站都使用CNN来检测人脸,然后执行标记等任务。
物体检测
CNN同样能够检测图像中的物体。有几种基于CNN的架构用于检测物体,其中最受欢迎的是R-CNN(Region CNN)。一个R-CNN的工作原理是应用选择性搜索来找出区域,然后使用CNN进行分类,一次一个区域。
图像字幕
该任务包括为图像创建文本描述。执行图像字幕的一种方法是用循环神经网络(RNN)替换第二部分中的全连接层。
语义分割