MORAN: A Multi-Object Rectified Attention Network for scence text recognition
Pattern Recognition 2019
一、Introduction
MORAN分为两部分一个是对形变input image的校正网络MORN(multi-object rectification network)和对矫正后照片的识别网络ASRN(attention-based sequence network)。除了整体架构,作者还强调了两种提升训练效果的方法,因为这个端到端的网络比较难训练。一个是fractional pickup method用于提升ASRN的训练效果,一个是curriculum learning用于训练MORAN这个端到端的网络。
整体网络架构
二、具体实现
2.1 MORN 校正网络