【机器学习开放项目】字符识别(数字)数据集

在这里插入图片描述
光学字符识别和简单的数字识别任务一直是机器学习研究的热点。

Optical character recognition, and the simpler digit recognition task, has been the focus of much ML research.

关于这个主题,我们有两个数据集。

We have two datasets on this topic.

第一个数据集解决的是更普遍的OCR任务,只涉及一小部分词汇:(请注意,每个单词的第一个字母都被删除了,因为首字母是大写字母,会使任务更难完成。)

The first tackles the more general OCR task, on a small vocabulary of words: (Note that the first letter of each word was removed, since these were capital letters that would make the task harder for you.)

项目建议:

在普遍的OCR情况下,使用HMM利用相邻字母之间的相关性来提高识别的准确性。(由于邮政编码在相邻的数字之间没有这样的限制,所以HMMs在数字识别中可能没有帮助。)

Use an HMM to exploit correlations between neighboring letters in the general OCR case to improve accuracy. (Since ZIP codes don’t have such constraints between neighboring digits, HMMs will probably not help in the digit case.)

数据集下载地址:

http://ai.stanford.edu/~btaskar/ocr/

更多精彩文章请关注微信号:在这里插入图片描述

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值