新建模块 pom.xml依赖无法识别_Pytorch场景文字识别工具箱

【导读】Vedastr 是一个基于Pytorch的开源场景文字识别工具箱。

特性

模块化设计

我们将场景文本识别框架分解为不同的组件,并且可以通过组合不同的模块轻松构建定制的场景文本识别框架。

灵活性

Vedastr具有足够的灵活性,能够轻松更改模块中的组件。

模块扩展性

将新模块集成到vedastr项目中很容易。

支持多种框架

该工具箱支持几种流行的场景文本识别框架,例如CRNN,TPS-ResNet-BiLSTM-Attention,Transformer等。

很棒的性能

我们在深层文本识别基准中重新实现了最佳模型,并获得了更好的平均准确性。而且,我们实现了一个简单的基准(ResNet-FC),性能是可以接受的。

安装

系统要求

  • Linux

  • Python 3.6+

  • PyTorch 1.2.0 or higher

  • CUDA 9.0 or higher

安装Vedastr

1.  新建一个conda虚拟环境

conda create -n vedastr python=3.6 -yconda activate vedastr

2. 安装Pytorch与torchvision

conda install pytorch torchvision -c pytorch

3. 下载vedastr库

git clone https://github.com/Media-Smart/vedastr.gitcd vedastrvedastr_root=${PWD}

4. 安装依赖

pip install -r requirements.txt

数据准备

  1. 从下列网站下载数据

    https://github.com/clovaai/deep-text-recognition-benchmark

  2. 新建数据文件夹

    cd ${vedastr_root}
    mkdir ${vedastr_root}/data
  3. 按下列结构组织下载好的数据

    data└── data_lmdb_release    ├── evaluation    ├── training    │   ├── MJ    │   │   ├── MJ_test    │   │   ├── MJ_train    │   │   └── MJ_valid    │   └── ST    └── validation

训练

python tools/trainval.py configs/clova.py

测试

python tools/test.py configs/clova.py path_to_clova_weights

9afe781e7ae7dcb01d927bdd56fddf1e.gif

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料! 5241cf81783003ea42a3bbc47203181e.png 欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询ac7628814273c94601478d03d4d3d52b.png 点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值