简记DBNet

《简记DBNet》

  文本检测常用的模型,如果要检测多个类别,多加 DBHead 是一种方式,而且dbnet 的一个弊端就是有重叠的文本框目标无法区分。

Key Words:dbnet


Beijing, 2022

DBNet 网络结构

  1. backbone: Resnet18
  2. neck:FPN
  3. head:DBHead
    • fm 经过各种卷积上采样4倍得到 prob_mask 利用 bce loss训练
    • fm 经过另外各种卷积上采样4倍得到 threshold_mask 利用 L1 训练
    • sigmoid(k * (prob_mask - threshold_mask) )经过 DB (可微分二值化)得到 binary mask 利用 bce loss 或 dice loss 训练

DBNet 后处理操作

  1. 模型推理得到的结果,如下图右上角所示 记为 pred_prob_mask
  2. 对 pred_prob_mask 取 0.3 阈值二值化,删除较小的噪声区域
  3. cv2. findcontours 得到包围每个二值化前景区域的点集合 记为 pred_pts
  4. 对 pred_pts 进行反 shrink 操作得到 pred_ori_pts
  5. 利用 minAreaRect 得到从 pred_ori_pts 得到最小包围框(可以不是水平的矩形,4个点,8个值),画到原图上如下图左下角所示
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值