深度学习
minjialong
这个作者很懒,什么都没留下…
展开
-
CTC原理介绍
https://github.com/parlance/ctcdecode原创 2019-10-27 21:27:34 · 1671 阅读 · 2 评论 -
目标检测模型------Faster_RCNN模型
深度学习在目标检测领域按处理步骤分为两种,第一种称为two_stage,以Faster-RCNN为代表,第二种称为one_stage,以YOLO,SSD等为代表。这里先从最经典的Faster-RCNN开始,从流程图,组件结构,实现细节,训练要点方面进行介绍,如有不妥之处,欢迎指正。Fater-RCNN流程图 如上图所示,conv_layers是指特征特征提取层,feature_...原创 2019-05-24 15:12:51 · 927 阅读 · 0 评论 -
PSENet原理介绍
前面我们介绍了经典的目标检测,这里我们来学习一篇OCR领域最新的论文,改论文提出了一个新的文字检测思路–PSENet。整体框架 如上图所示该模型主干网络使用ResNet系列(可以根据自己需要调整),输入图像维度为:[B,3,H,W][B, 3, H, W][B,3,H,W],通过下采样,特征融合,上采样,最后得到得到与原图片尺寸相同的输出F,维度大小为:[B,C,H,W][B,...原创 2019-08-04 18:43:17 · 22728 阅读 · 34 评论