![](https://img-blog.csdnimg.cn/20190918140129601.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
OCR
OCR论文以及零零散散的项目
只会git clone的程序员
博客资料链接失效或者文件找不到可以私信索要!
当前在探索的领域:机器瞎学 人工智障 模式混淆 数据掩埋 计算机幻觉 劝退系统
展开
-
TextFuseNet:具有更丰富融合功能的场景文本检测论文翻译
TextFuseNet:具有更丰富融合功能的场景文本检测摘要自然场景中任意形状文本的检测是一个极具挑战性的问题任务。不像现有的文本检测方法都是基于有限的特征表示,本文提出了一种新的文本检测框架TextFuseNet,以探索利用更丰富的特征融合进行文本检测。更具体地说,我们提出从字符、单词和全局三个层次的特征表示来感知文本,然后引入一种新的文本表示融合技术来实现鲁棒的任意文本检测。多层次特征表示可以在保持文本整体语义的同时,通过将文本分解为单个字符来精确地描述文本。然后,TextFuseNet通过一个多路翻译 2020-12-14 16:09:27 · 1056 阅读 · 0 评论 -
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks
Towards Accurate Scene Text Recognition with Semantic Reasoning Networks基于语义推理网络的精确场景文本识别摘要场景文本图像包含两个层次的内容:视觉文本和语义信息。尽管过去几年来,已有的场景文本识别方法取得了很大的进展,但是对于挖掘语义信息来辅助文本识别的研究却很少有人关注,只探索了类RNN结构的隐式语义模型信息。但是, 我们发现基于RNN的方法存在着一些明显的缺点,如解码方式依赖时间,语义上下文的单向串行传输,极大地限制了语义信息翻译 2020-12-16 16:38:42 · 1571 阅读 · 0 评论 -
还在愁做OCR法方向没有开源数据集嘛,PaddleOCR的这个工具你敢不敢看一下?
近期,PaddleOCR开源了Style-Text数据合成工具。https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/StyleText/README_ch.md到底多强结合GAN,输入一串文本和一个风格图片就可以生成对应的场景的图片!!!!!项目开源直接使用无需训练!!!!效果⬇️该工具可以批量合成大量与目标场景类似的图像,如下图所示。Style-Text数据合成工具是基于百度自研的文本编辑算法《Editing Text in the原创 2020-12-16 17:42:37 · 400 阅读 · 0 评论 -
PaddleOCR —— 动态图训练
官方repo:github地址可以star代码关注更新情况,最近在迁移代码到动态图,可能更新较频繁~下载代码https://github.com/PaddlePaddle/PaddleOCR.git切换分支git checkout dygraph创建训练的配置文件Global: use_gpu: true epoch_num: 500 log_smooth_window: 20 print_batch_step: 10 save_model_dir: ./output原创 2020-11-25 14:13:34 · 866 阅读 · 0 评论 -
PaddleOCR——训练总结
记录下训练碰到的问题自己合成的数据在MLT验证精度非常低原因:合成数据与真实数据差别较大,表现结果是在合成数据上拟合结果非常好,在真实数据上效果差,存在向合成数据过拟合的问题,解决办法增加真实数据(但这个不好找)、对真实数据进行数据增广(应该可以吧)、拿合成数据训练的best模型在真实数据上finetune(在测试)。合成数据的best模型作为预训练模型在真是数据上finetune时最开始acc=0.0原因:我使用的预训练模型是在合成数据上识别日语并且验证集准确度最高有83%左右,并且用这个模型在真原创 2020-11-18 18:59:56 · 2608 阅读 · 0 评论 -
PaddleOCR —— 导出训练模型并测试(俄语)
使用paddleocr训练好代码后可以拿到三个文件:路径在PaddleOCR/output/rec_russia下,其中这个rec_russia是我自己训练的日语的识别的存放路径,可以在对应的训练yaml里面修改。第一步:转换模型成inference模型python3 tools/export_model.py -c ./configs/rec/multi_languages/rec_russia_lite_train.yml -o Global.checkpoints=./output/rec_r原创 2020-11-16 16:05:34 · 2018 阅读 · 0 评论 -
PaddleOCR —— 训练数据准备
数据生成数据生成代码地址:https://github.com/oh-my-ocr/text_renderer垂直数据生成地址:https://github.com/zcswdt/Color_OCR_image_generator/blob/c2a7138be2107b3b3736b76badf5c012c6befe0c/OCR_image_generator.py#L340将竖直生成加入textrender代码地址:https://github.com/xmy0916/textrender原创 2020-11-04 11:38:11 · 683 阅读 · 0 评论 -
PaddleOCR —— 训练数据
创建训练数据cd ./train_datawget http://10.12.121.133:8901/data/ic15_data.tartar -xvf ic15_data.tar下载预训练模型wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/rec_mv3_none_bilstm_ctc.tarcd pretrain_modelstar -xf rec_mv3_none_bilstm_ctc.tar &&原创 2020-10-29 17:43:32 · 1547 阅读 · 0 评论 -
docker编译paddlepaddle记录
环境CUDA 10.0cudann 7paddlepaddle-realse-1.8.0步骤下载源码git clone https://github.com/PaddlePaddle/Paddle.git创建docker容器cd Paddlenvidia-docker run --name paddle-test -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gpu-cuda1原创 2020-10-29 12:51:23 · 355 阅读 · 0 评论 -
PaddleOCR —— 本地安装
简介记录下本地安装PaddleOCR的过程,repo地址:PaddleOCR的github地址。开源的文字识别库还是很香的,star起来。第一步:关注Repo,更新了不迷路点上star和fork,感觉代码全是我写的哈哈哈哈第二步:下载代码选择git clone下载或者直接点击按钮下载都行:第三步:本地创建工程并用pycharm打开我这里创建了一个叫paddleOcr的文件夹放ocr的代码:第四步:安装依赖打开pycharm底下的终端输入下面命令安装,就会自动安装上所有需要的依赖:c原创 2020-10-23 21:05:59 · 4542 阅读 · 6 评论