MMOCR-DBNET：概率图、阈值图和二值化图和标签生成

嘉城学习笔记

已于 2023-10-13 16:13:37 修改

阅读量450

点赞数

文章标签：深度学习人工智能

于 2023-10-13 16:05:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63944097/article/details/133810059

版权

概率图、阈值图和二值化图生成

概率图生成

反卷积，将尺寸大小还原成输入图，通道数将为1

阈值图生成

二值化图生成

传统的二值化，直接给定某个阈值，所以没法直接用于训练，可微的二值化函数，如下（其实就是一个带系数的sigmoid）

P代表概率图，T代表从网络中学习到的自适应阈值图；k是膨胀因子（经验性设置k=50）

标签生成

概率图标签生成

ignore_flags表示文本框是否忽略

生成一张大小640，640，全为0的图

遍历图中所有多边形标注框，对每个多边形标注框进行内缩（-distance）

下图中红线是标注框，绿线是外扩线，蓝色为内缩线，外扩内缩距离都为D

阈值图标签生成

遍历所有标注框

计算膨胀距离D并进行膨胀

polygon用expanded_polygon替换

利用广播机制通过xs、ys表达这个外框区域所有像素点的坐标

标注框两个点确定一条线段，遍历所有的线段，计算区域内到坐标框的距离，通过余弦定理和面积公式。选取最短距离，除以之前算好的距离D，进行归一化。（mmocr中的公式有所出入）这个距离会用clip控制在0到1之间，框内超过距离D的像素点归一化之后的值肯定大于1。

划定范围，用1去减归一化的结果

嘉城学习笔记

博客等级

码龄3年

5
原创

34
点赞

41
收藏

32
粉丝

关注

私信

热门文章

最新评论

qt.qpa.xcb: could not connect to display
2401_87027531: 添加后报错os未定义
BEVFormer的环境配置，依赖mmdetection3d-0.17.1
CSDN-Ada助手: 恭喜你写了第5篇博客！你对BEVFormer的环境配置和依赖mmdetection3d-0.17.1的介绍非常详细。看到你一直在持续创作，我真的很欣赏你的热情和努力。对于下一步的创作建议，如果可能的话，我希望你可以分享一些实际应用案例或者深入解析一些具体的技术细节。当然，这只是一个建议，我知道你已经做得很好了。期待你未来更多精彩的博客！
swintransformer算法原理与代码debug
CSDN-Ada助手: 恭喜博主对swintransformer算法进行了深入的研究和代码debug！希望您能继续保持创作的热情和耐心，不断深入探索算法原理和代码实现细节。或许接下来可以考虑分享一些实际应用场景下的案例分析，或者对比不同算法在特定问题上的表现。期待您的下一篇博客！
qt.qpa.xcb: could not connect to display
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你对解决qt.qpa.xcb连接显示问题的探索和总结，让我感到非常欣慰。接下来，我建议你可以尝试分享一些你自己在解决这个问题中的实践经验，或者是对于qt.qpa.xcb的一些深入研究，这样可以更好地帮助到其他遇到类似问题的读者。希望你可以一直坚持下去，期待你更多的精彩内容！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。