paper : Detecting Oriented Text in Natural Images by Linking Segments
github地址:https://github.com/dengdan/seglink
参考博客:https://blog.csdn.net/u011440558/article/details/78564615
这篇博客是我按照github上大神开源代码后,然后我在自己的环境下复现出来的实践笔记,这也是我第一次写博客,文笔粗糙,望大家海涵,接下来步入正题。论文中也只是检测到了文本行的框,并没有进行识别,检测出来的最终结果会在指定路径下保存为和每张输入图片名字相对应的txt文档,命名格式为:res_图片名称.txt。
一、我的配置环境
(1)tensorflow-gpu 1.1.0
(2)opencv3.1.0
(3)python2.7
二、具体安装步骤
- 首先根据上面的github地址下载源码及数据集和对应的model,下载两个压缩包,pylib-python3.zip、seglink.zip和两个数据集包SynthText、ICDAR2015。
- 安装opencv3.1.0,这个版本的opencv在我的电脑上已经安装,如果你的版本是opencv2.4.9,则需要安装opencv3.1.0。
参考地址:http://blog.csdn.net/u011440558/article/details/78358447
opencv3.1.0具体安装步骤如下:(ubuntu16.04安装opencv3.1.0)
推荐安装opencv3.4.2网址:https://blog.csdn.net/hu_helloworld/article/details/80251237
- 安装依赖库
sudo apt-get install build-essential
# 必须的,gcc编译环境
suo as
sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
udo apt-get install build-essentiapt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev lale-de
# 必须的,包括cmake等工具
sudo apt
sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev
-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev
# 可选的,看个人需要,总共5M左右
- 下载源码
官网下载:http://opencv.org/downloads.html
或者git clone:
cd ~/o
cd ~/opencv310
pencv310
# opencv310为自己新建文件夹,源码将放在这里
git clone https://github.com/Itseez/opencv.git
git clone https://github.com/Itseez/opencv_contrib.git
- 使用cmake安装