Windows10+yolov3+文本检测

本文档介绍了在Windows10系统上使用GPU搭建YOLOV3进行文本检测的步骤,包括CUDA、CUDNN、VS2015的安装,以及openCV的配置。详细阐述了如何将ICDAR2011数据集转化为YOLO格式,调整网络配置,训练模型,并解决训练过程中遇到的内存溢出问题。
摘要由CSDN通过智能技术生成

YOLOV3 文本检测

windows 环境搭建 GPU版

1.CUDA9.1

2.CUDNN7.0.5

3.VS2015

安装,默认省去很多麻烦

4.openCV3.4.0

安装,参照下面附加依赖库路径,不同则修改附加依赖库

VS编译:

1.release+x64

2.opencv附加依赖库

本地opencv安装路径下的include与lib文件夹

3.编译

源码目录darknet-master\build\darknet\64下生成darknet.exe文件

yolov3 文本检测训练

1.下载ICDAR2011文本检测数据集

链接:https://pan.baidu.com/s/18EMWhKIHe2RVUx5iGZvlkA
密码:7ez9

2.解压将train-textloc目录下训练数据转化为yolo格式

  • train-textloc中包含了图片及text真实位置信息,首先根据gt__(img___name).txt文件生成VOC格式的XML标签文件,代码实现如下,修改路径即可

    _#! /usr/bin/python
    _#-*-coding:utf8-*-
    
    import os, sys
    import glob
    from PIL import Image
    
    _# ICDAR 图像存储位置
    src_img_dir = "train-textloc/train-textloc"
    _# ICDAR 图像的 ground truth 的 txt 文件存放位置
    src_txt_dir = "train-textloc/train-textloc"
    
    img_Lists = glob.glob(src_img_dir + '/*.jpg')
    
    img_basenames = [] # e.g. 100.jpg
    for item in img_Lists:
    img_basenames.append(os.path.basename(ite
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值