顶象生僻字点选模型识别

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
如有侵犯,请联系作者下架

该文章模型已经上线ocr识别网站,欢迎测试!!,地址:http://yxlocr.nat300.top/ocr/textclick/5

某网站使用顶象的生僻字点选模型,部分数据集如下:
在这里插入图片描述

在这里插入图片描述
这种数据集对于训练而言,还是照常的分类,问题在于打码的难度,该网站初步统计,生僻字占到2k多个,但是没有办法,生僻字还是要照常打码,但是如果对于全部的生僻字都去打码一定的数据集,那么打码的成本会高很多,所以可以采用真实数据集混生成数据集去训练,虽然准确率会降低一点点,但是打码的成本大大降低,这里,我使用了二十多个字体

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码王吴彦祖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值