ocr文本识别
文章平均质量分 88
ocr文本识别
甜甜圈Sweet Donut
江湖夜雨,雁过无痕。
因爲興趣,所以喜歡。
展开
-
【pdf翻译中文】免费自用日语pdf转中文、韩语pdf转中文(也可以转英文)或者其他小语种法语、德语pdf转中文
【pdf翻译】免费自用日语pdf转中文、韩语pdf转中文(也可以转英文)或者其他小语种法语、德语pdf转中文不是很精确、有点慢,但是也够用,胜在免费free。原创 2022-11-27 14:39:25 · 2987 阅读 · 2 评论 -
【论文阅读】Attention 机制在脱机中文手写体文本行识别中的应用
论文信息:作者: 王馨悦,董兰芳( 中国科学技术大学计算机科学与技术学院,合肥230027)E-mail: wxy66@ mail. ustc. edu. cn该方法在针对具有语义信息的CASIA-HWDB2.0-2. 2 数据集上字符准确率达到了95. 76%,比传统的encoder-decoder 框架提升了12.83%.关键词: 文本行识别; 脱机中文手写体; Attention 机制; LSTM中图分类号: TP391 文献标识码: A 文章编号: 1000-1220( 2019)原创 2020-06-18 16:15:35 · 1975 阅读 · 0 评论 -
【总结】cnn+bilstm+lstm 训练的一些技巧
预处理:BLSTM 分为两类,第一类不支持变长输入,第二类支持变长输入. 显然,由于我们的手写体文本行的长度都是不固定的,所以采用的是支持变长输入的BLSTM. 这里的变长 不是指任意长度,而是多个固定长宽。根据CASIA-HWDB2.0-2. 2 数据集中文本行图片的大小,采取的固定长宽分别为:[240,130]、[400,180]、[560,180]、[640,180]、[800,180]、[950,200]、[1030,200]、[1210,180]、[1290,200 ]、[1370, 200原创 2020-05-25 18:12:47 · 4712 阅读 · 0 评论 -
【代码实现和训练】OCR技术——引入了Attention机制的crnn的印刷体汉字识别
前言这里先是参考了这个代码:加入attention的crnn印刷体识别,on pytorch然后我训练了大概3个小时,loss从72出发稍微下降后维持在62.xxx 左右,就很迷。测试效果全部识别为“的的的的的的”,不过看到他的训练结果,感觉也并不是很感人,他的训练大概得到88%左右的正确率,loss 大约2.xx可能加入数据集去训练或者是增加迭代次数和修改学习率以及网络的optimizer可以达到想要的95%以上效果。这里有个解释和分析了上述代码的博客,但是也没放出训练效果,估计这个代码还是原创 2020-05-31 10:31:36 · 1888 阅读 · 2 评论