街景字符编码识别赛事Task01-赛事理解

最新推荐文章于 2020-06-02 21:52:21 发布

weixin_41948788

最新推荐文章于 2020-06-02 21:52:21 发布

阅读量105

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41948788/article/details/106245871

版权

赛题来源自Google街景图像中的门牌号数据集（The Street View House Numbers Dataset, SVHN），并根据一定方式采样得到比赛数据集。

训练集数据包括3W张照片，验证集数据包括1W张照片，每张照片包括颜色图像和对应的编码类别和具体位置；为了保证比赛的公平性，测试集A包括4W张照片，测试集B包括4W张照片。

运行系统要求：Python2/3，内存4G，有无GPU都可以。用CPU跑的话会比较慢。

具体的流程包含以下几块：
1：引入必要的模块包括PIL模块 numpy模块 pytorch模块等
2：定义读取数据集主要是利用的是train数据集 test数据集 val数据集中的相关数据
3：定义读取数据dataloader 这是pytorch中指定的数据存储格式
4：定义分类模型这里使用的主要是resnet网络进行图像特征的提取
5：训练与验证利用设置的验证集来测试上面得到的网络层的性能
6：预测并生成提交文件

整个网络的性能可以通过调整网络层的结构和相关超参数来优化当然数据集本身也是很重要的可以对数据集进行一些调整

weixin_41948788

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。