- 博客(5)
- 收藏
- 关注
原创 Pyramid Mask Text Detector阅读笔记
2020.9.9Pyramid Mask Text Detector 作者分析了先前以Mask-RCNN为基础的方法存在的问题,并在此基础上提出了改进办法并设计了PMTD。问题分析1.多数文本检测数据集采用矩形框坐标的形式标注文本所在位置,与Mask-RCNN中使用Mask来区分前后景区域的思想相悖。使用矩形标签训练并不能凸显Mask-RCNN的优势;2.根据矩形坐标标签虽然也可以生成像素级的分割标签以用于训练Mask-RCNN类方法,但其中存在大量的假真区域,由于标签形状的限制,图中存在大量的
2020-09-10 15:44:48 264
原创 阅读笔记:YOLO9000:Better,Faster,Stronger
YOLOv2BetterYOLOv2相对于初代YOLO的改进非常大:弃用“方格责任制”,改用anchor box;新的骨干网络darknet-19;全新的预测数据输出结构,除目标位置信息外,还可以输出基于wordnet基础上详细的分类数据;全新的训练策略,切换输入像素大小,检测与分类交替训练等。BetterYOLOv2尤其针对初代YOLO定位误差大、低召回率的问题,结合先前别人的...
2020-04-28 01:16:45 258
原创 Loss Function
L1 Loss:Creates a criterion that measures the mean absolute error (MAE) between each element in the input :math:x and target :math:yℓ(x,y)=L={l1,…,lN}⊤,ln=∣xn−yn∣ \ell(x, y) = L = \{l_1,\dots,l_N\}^...
2020-04-09 22:46:15 202
原创 阅读笔记:You Only Look Once: Unified, Real-Time Object Detection
阅读笔记:You Only Look Once: Unified, Real-Time Object Detection背景算法设计网络结构实验设计\quad\quadYOLO算法(原文链接:https://arxiv.org/abs/1506.02640)是CVPR2016上由Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi四...
2020-03-26 22:37:44 241
原创 对Bi-Directional Cascade Network for Perceptual Edge Detection一文的初步理解
对Bi-Directional Cascade Network for Perceptual Edge Detection一文的初步理解BDCN研究背景相关工作数学证明BDCNBi-Directional Cascade Network for Perceptual Edge Detection一文由北京大学的Jianzhong He,Shiliang Zhang,Tiejun Huang及H...
2019-09-15 21:44:24 10700 18
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人