PaddleOCR
锦鲤AI幸运
---2016年---,初来乍到,冲鸭~~~~~
---2020年---,第一次记录博客,好活当赏O(∩_∩)O哈哈~
展开
-
下载cc.en.300.bin,解决ValueError: cc.en.300.bin cannot be opened for loading
cc.en.300.bin为 157 种语言分发预训练的词向量原创 2022-03-30 18:21:55 · 1771 阅读 · 0 评论 -
SimpleDataSet转为LMDB数据格式,txt转LMDB数据集格式
训练深度学习时,遇见所需要的数据集格式时LMDBDataSet 比较常见的好用的标注用于训练OCR模型的数据标注工具不多,很少有标注出来就是LMDB格式的。比如半自动标注工具PPOCRLabel。输出来的格式就是如下txt文件(训练集路径, 所对应的标签)这样的格式就是SimpleDataSet。只要做到这一步,后续转为LMDB就简单一些了。项目结构如下:代码如下import lmdbimport cv2import numpy as npimport osOUT原创 2021-09-22 11:23:57 · 1831 阅读 · 9 评论