文本检测入门论文阅读笔记

文本检测入门论文阅读笔记
白翔 关于文本检测的综述
1.文字检测的定义: 确定整幅图像中定位文字的位置,其中分为水平和倾斜两种文本区域
水平的文字区域有四个参数(中心点的坐标(x,y) 框的宽度w 框的高度h )
倾斜的文字区域有五个参数(中心点的坐标(x,y) 框的宽度w 框的高度h 包围盒和水平方向上的角度)或者四个顶点坐标的八个参数
2.检测分类:
①基于局部的方法:先检测出字符或者局部,在聚合成单词;
②基于单词的方法:类似于目标检测的方法;
③基于文本行的方法:先检测出文本行,再将文本行分词得到单词的包围盒。
3.检测具体可能的方法:

  1. 基于文字框的端到端的文字检测器
    TextBoxes的端到端的可训练的仅需要一个网络的前向传播步骤非最大值抑制操作
    改进点:1)修改卷积核微细长型的;2)调整默认包围盒的长宽比
    2.基于文字片段的文字检测器
    SegLink先检测文字片段和预测片段之间的连接关系

白翔 适用于文字检测的候选框提取算法(没看完 暂停)
1.文字区域的响应与分割
把落在包围盒外面的像素点视作负样本,内的视作正样本,做全卷积网络模型的训练。1)利用训练好的模型产生文字区域响应图;2)窗口大小为k高斯滤波器对响应图进行平滑处理,设定判别阈值T进行二值处理;3)八方向领域联通求解,并计算最小包围盒。
2.基于EdgeBox的文字候选框提取

张拯 白翔 硕士毕业论文 适用于文字条的自然场景文字检测算法研究 2016
A.基于对称性的水平文字检测算法
1.1设计并训练检测器估计每个点为文字中轴的概率
特征提取: 对称性特征(分为四个区域 中轴线相近的为相似性特

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值