字符识别模型

最新推荐文章于 2023-12-01 14:15:10 发布

wgj839977837

最新推荐文章于 2023-12-01 14:15:10 发布

阅读量176

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wgj839977837/article/details/106368215

版权

目标检测专栏收录该内容

3 篇文章 0 订阅

订阅专栏

字符识别模型

backbone选取
检测头选取
损失函数构建
模型实现

backbone选取

初步选定resnet18作为encoder一共进行三次降采样进行特征提取，并构建可变形卷积的decoder进行三次上采样到原始图像大小

检测头选取

检测头包括33卷积，RELU和11卷积，在上采样的特征图上进行密集像素每个位置像素是中心点的置信度。

损失函数构建

损失函数采用cornernet中改进的FocalLoss，在每个真值中心点位置通过高斯平滑生成真值中心点热图，

模型实现

模型采用Pytorch框架实现，并利用imgaug库进行数据增强包括几何变换，颜色，高斯噪声等多种增强方法，优化器采用warm up+Adam的方式进行训练,学习率设置为0.02，batch大小为500.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
字符识别模型

字符识别模型backbone选取检测头选取损失函数构建模型实现backbone选取初步选定resnet18作为encoder一共进行三次降采样进行特征提取，并构建可变形卷积的decoder进行三次上采样到原始图像大小检测头选取检测头包括33卷积，RELU和11卷积，在上采样的特征图上进行密集像素每个位置像素是中心点的置信度。损失函数构建损失函数采用cornernet中改进的FocalLoss，在每个真值中心点位置通过高斯平滑生成真值中心点热图，模型实现模型采用Pytorch框架实现，并利用i
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。