Pixel Aggregation Network (PAN)

1 网络结构

在这里插入图片描述
训练阶段,网络生成三个预测:

  1. Text Region
  2. Kenel
  3. Similarity Vector

其中 1 和 2 为监督学习,3 为无监督学习(聚类)。

预测阶段,遵循以下步骤来使用相似度向量引导像素聚合到Kenel中

  1. 得到多个 Kenel;
  2. 对于每个 Kenel 的上下左右四个方向的像素,为 Text Region 内的每个像素找到与 Kenel 的欧式距离小于 d d d (作者设置为 6 )的像素并将其聚合;
  3. 重复步骤 2 知道没有可用的像素。

    在这里插入图片描述         在这里插入图片描述

Kernel 是在 Text Region 里面的。

2 损失函数

在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值