RCNN (Region-based Convolutional Neural Network):
RCNN主要用于目标检测,即在图像中识别和定位物体。RCNN采用两阶段的检测流程。首先,使用选择性搜索等方法生成候选区域,然后对每个候选区域应用卷积神经网络(CNN)来提取特征,最后使用分类器和回归器对这些特征进行目标分类和定位。
RCNN的后续版本包括Fast R-CNN和Faster R-CNN,这些方法在提高速度和精度方面进行了改进。
CRNN (Convolutional Recurrent Neural Network):
CRNN主要用于处理序列数据,例如文本识别和语音识别等任务。CRNN结合了卷积神经网络(CNN)和循环神经网络(RNN)。CNN提取序列中的局部特征,RNN捕捉序列中的上下文关系。这使得CRNN非常适用于处理不定长度的序列数据。
典型的应用包括图像中的文字识别(OCR,Optical Character Recognition)和语音识别,其中CRNN能够同时考虑到文本的局部特征和全局上下文。