一、导读
OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR
短短几个月,累计Star数量已超过8.5K,
频频登上Github Trending 日榜月榜,
称它为 OCR方向目前最火的repo绝对不为过。
最近,它又带来四大新发布与升级:
核心内容先睹为快:
-
全新发布数据合成工具Style-Text: 可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升15%以上。
-
全新发布半自动数据标注工具PPOCRLabel: 有了它数据标注工作事半功倍,相比labelimg标注效率提升60%以上,社区小规模测试,好评如潮。
-
多语言识别模型效果升级: 在开源测试集评估,中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。
-
PP-OCR开发体验再升级: 支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。
二、PaddleOCR历史表现回顾
先看下PaddleOCR自去年6月开源以来,短短几个月在GitHub上的表现:
-
6月,8.6M超轻量模型发布,GitHub Trending