阿里天池竞赛分享

最新推荐文章于 2024-05-15 21:26:31 发布

tyong

最新推荐文章于 2024-05-15 21:26:31 发布

阅读量5.5k

点赞数 3

文章标签：天池竞赛 TensorFlow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tyong/article/details/80853464

版权

最近参加阿里天池的“网络图像的文本检测”挑战赛，终于结束，最终排名第181，总共是1424只队伍参加。第一次参加机器学习挑战赛，成绩不是很理想，今天把一些体悟写一下，希望对后来参加的人有用。

一、赛题简介

在互联网世界中，图片是传递信息的重要媒介。特别是电子商务，社交，搜索等领域，每天都有数以亿兆级别的图像在传播。图片文字识别（OCR）在商业领域有重要的应用价值，是数据信息化和线上线下打通的基础，也是学术界的研究热点。然而，研究领域尚没有基于网络图片的、以中文为主的OCR数据集。本竞赛将公开基于网络图片的中英混合数据集，该数据集数据量充分，涵盖几十种字体，几个到几百像素字号，多种版式，较多干扰背景。期待学术界可以在本数据集上作深入的研究，工业界可以藉此发展基于OCR的图片管控，搜索，信息录入等AI领域的工作。

二、数据集

我们提供20000张图像作为本次比赛的数据集。其中50%用来作为训练集，50%用来作为测试集。该数据集全部来源于网络图像，主要由合成图像，产品描述，网络广告构成。典型的图片如图1所示：

图1：典型图片

</

最低0.47元/天解锁文章

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
7
评论
阿里天池竞赛分享

最近参加阿里天池的“网络图像的文本检测”挑战赛，终于结束，最终排名第181，总共是1424只队伍参加。第一次参加机器学习挑战赛，成绩不是很理想，今天把一些体悟写一下，希望对后来参加的人有用。一、赛题简介在互联网世界中，图片是传递信息的重要媒介。特别是电子商务，社交，搜索等领域，每天都有数以亿兆级别的图像在传播。图片文字识别（OCR）在商业领域有重要的应用价值，是数据信息化和线上线...
复制链接

扫一扫

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。