LSTM 与 CTC loss (以及DP、HMM)

最近在OCR识别,用到了CTC loss。只能说爱你不容易啊。 1、CTC解决什么问题? [1] Sequence to sequence learning [2] Unsegmented real-valued input stream (一般用于语音与光符字体识别)...

2018-02-27 16:01:18

阅读数 6868

评论数 18

图算法系列二 网络诈骗检测

为了方便,本文的算法展示采用networkx, 接下来的文章主要以networkx为基础,说明图算法的应用 Page Rank is a well-known algorithm developed by Larry Page and Sergey Brin in 1996. ...

2019-04-17 17:51:01

阅读数 91

评论数 0

图算法系列一 boost graph Algorithm基本使用

本文详细介绍图算法以及boost graph algorithm的应用

2019-04-12 10:18:33

阅读数 20

评论数 0

强大的imageMagick

用了差不多一年的imageMagick,它提升了我的工作效率,本文主要总结一下这里的奇技淫巧 一、图像基本操作 1.1、图像resize convert -resize 50% input.jpg output.jpg # 缩放到原来的一半 convert -resize 100X100 in...

2018-12-04 20:25:41

阅读数 80

评论数 1

Image Caption

1 image caption 的阶段性飞跃。 Year Paper Abstract 2015 Show, Attend and Tell: Neural Image Caption Generation with Visual Attention Inspired by rec...

2018-11-30 16:10:22

阅读数 127

评论数 1

Pytorch0.2.0 源码安装与使用

由于最新项目需要,pytorch必须是0.2.0 版本。中间遇到了很多坑,记录如下。 Pytorch0.2.0 源码安装 首先下载pytorch0.2.0的源码解压. 在linux上可以运行 python setup.py install 在mac 上执行MACOSX_DEPL...

2018-08-02 17:08:00

阅读数 2454

评论数 5

大型项目CMakeLIsts.txt的编写规范

1、Very simple executable PROJECT( helloworld ) # 非必需 SET( hello_SRCS hello.cpp ) ADD_EXECUTABLE( hello ${hello_SRCS} ) 说明: ADD_EXECUTABLE crea...

2018-07-05 19:21:00

阅读数 696

评论数 0

OCR 预处理与检测

前言: 通用OCR领域的最难的是预处理与检测,目标检测领域我们常看到的是横平竖直, 也就是说:检测到的边框平行或垂直于图像边界。 但是,在OCR中,文字的方向可以是各种方向;而且长宽比不确定,各种场景,各种尺寸、各种语言、各种艺术字体。而且,目前多角度检测fatal 弱点:文本行比较长...

2018-03-22 20:45:17

阅读数 2383

评论数 0

Deep Learning with Python

1、学习地址Deep Learning with Python(wang@123)2、大神的twitter大神的twitter

2018-01-04 11:07:58

阅读数 2067

评论数 1

Google 的Protobuf 技术详解

1、例子 官方例子,建立一个 test.proto 内容如下: syntax = "proto2";package tutorial;message Person { required string name = 1; required int32 ...

2017-12-20 14:45:06

阅读数 218

评论数 0

python 的 matplotlib

本文会一直更新matplot的画图技巧,使用方法 matplotlib教程matplotlib API1、实例一 本实例展示了matplotlib画图的基本流程 import matplotlib.pyplot as plt # step 1 prepare data x = [1,2,3,...

2017-12-04 09:39:42

阅读数 229

评论数 0

机器学习任务的state-of-art之github及个人总结

前言 深度神经网络其实更加适合做感知,而贝叶斯理论的核心是推理,只有从感知到推理才能到决策。所以最终来讲,你希望达到一种理性的推理、理性的决策,这里面正好是贝叶斯网络一个大行其道的地方—余凯 1. State-of-the-art result for all Machine Learni...

2017-11-21 14:32:47

阅读数 1183

评论数 0

C++中的函数指针与宏函数总结

今天看项目代码才发现,函数指针分两种:普通函数指针,类成员函数指针。 那这两中函数指针的定义方法是不一样的。 1、普通函数指针typedef void (*Dfun) (float, int); //(*Dfun) 实际上是(::*Dfun) 也就是全局的意思 // Dfun 指向...

2017-11-13 16:52:17

阅读数 430

评论数 0

OpenCV常用Mat、Point、Rectangle等数据结构总结

本文主要总结Opencv的常用数据结构 总结的初衷是:我发现OpenCV居然没有对Mat元素求和的操作。!!因此好好总结 1、Mat CV_8UC1 // 8位无符号单通道 uchar CV_8UC3 // 8位无符号3通道 uchar CV_32FC1 ...

2017-10-25 15:16:51

阅读数 763

评论数 0

数字图像处理与OpenCV总结篇:一

做了3年多的图像处理,从本科毕设就做,到硕士毕业都没离开这个行业。本文旨在总结一下OpenCV与传统图像处理。 1、疑问? 自动16年初接触深度学习开始,读了一些图像paper。涉及图像识别(ResNet、googleNet系列)、目标检测(RCNN系列、YoLo)、人脸识别、OCR。 ...

2017-10-25 09:50:47

阅读数 1266

评论数 0

使用OpenCV中应当注意的几个问题

本文主要总结在工程项目中使用OpenCV库时候遇到的问题,并进行总结。 1、警惕浅拷贝 浅拷贝对于图像来说不是好事吗?减少了内存的开销。代码没那么笨重。但是分情况!! Mat img_a = imread("test.jpg"); ...

2017-10-24 16:26:07

阅读数 428

评论数 1

OCR 总结

最近3个月一直不做人脸相关任务了,现在做OCR 还是老规矩,先放上OCR的最前沿的论文。 1、state-of-art进展 https://github.com/hs105/Deep-Learning-for-OCR https://github.com/chongyangta...

2017-10-19 17:13:06

阅读数 554

评论数 0

C++中动态内存管理

本文总结C++ 中的内存管理,总结如下 【1】尽量用share_ptr管理资源(Efective C++条款13:以对象管理资源)shared_ptr (C++ Primer)自动销毁所管理的对象: 有层含义: 1、一个shared_ptr的实例引用...

2017-10-11 21:56:18

阅读数 266

评论数 0

ASM Algorithm (Active Shape Model) and its opencv implement

1、ASM解决什么问题? 一般而言,ASM做柔性刚体的目标检测任务。 首先,【柔性刚体】,可以认为是【人脸】以及现实生活中的刚体【一个茶杯】在图像中的表现【由于照相机的远近,以及被子的角度、旋转等】。 这类目标检测都:仅仅检测图像中感兴趣的某种物体(可以是多个),它不会检测多类别不...

2017-09-22 09:18:13

阅读数 421

评论数 0

OpenCV中RotatedRect 以及 Rect介绍

最近项目中用到RotatedRect 这里记录一下 //构建一个Mat(200*200) Mat image(200, 200, CV_8UC3, Scalar(0)); //设置一个旋转矩形3个参数分别为:质心(矩形中心),矩形长宽100、50 旋转角度:30 (clockwise) //R...

2017-09-11 15:01:07

阅读数 6921

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭