2017年12月_crediks

12月 11月 10月 09月 08月 07月 05月 04月 03月

原创 [论文笔记]Enhancement of SSD by concatenating feature maps for object detection

论文：Enhancement of SSD by concatenating feature maps for object detection 论文链接：https://arxiv.org/abs/1705.09587出发点：虽然深度网络的效果会随着feature map数量的增加而提升，但并不代表简单地增加feature map的数量就能达到更好的效果。本文利用特征金字塔的

2017-12-31 16:04:55 512

原创 ubuntu16.04中安装opencv2.4.9

1. 先下载OpenCV的源码 http://opencv.org/downloads.html2. 解压到任意目录 unzip opencv-2.4.9.zip3.进入源码目录 cd opencv-2.4.94. 事先安装下列软件 sudo apt-get install build-essenti

2017-12-27 15:50:37 6035 1

原创 c++二维数组指针

１.定义指针指向二维数组为了方便根据用户输入动态定义二维数组的行和列，引入变量rowsNum(行)，colsNum(列）。以定义５行４列的二维数组为例，int rowsNum = 4; int colsNum = 5; float** a = new float*[rowsNum]; for(int i = 0; i < rowsNum; i++) { a[i] = n

2017-12-26 21:47:04 29150 3

原创 [论文笔记]Feature Enhancement Network: A Refined Scene Text Detector

Feature Enhancement Network: A Refined Scene Text Detectorintro: AAAI 2018arxiv: https://arxiv.org/abs/1711.04249创新点：1.现有问题：只利用３×３的滑动窗口特征和利用高维度的特征对目标检测窗口进行精修，对于小的场景文字来说是不够的。创新点：提出Feature

2017-12-25 21:17:29 1244

原创 [论文笔记]Focal Loss for Dense Object Detection

论文：Focal Loss for Dense Object Detection论文链接：https://arxiv.org/abs/1708.02002 解决问题：提出一种新的损失函数：focal loss。该函数通过减少容易分类的样本的权重，使得模型在训练时更专注难分类的样本，从而改善样本的类别不均衡问题，改善模型的优化方向。难分类样本：举例说明：假设...

2017-12-21 21:03:13 824 1

原创深度学习中的batch的大小对学习效果有何影响？

写在前面：整理自知乎：深度学习中的batch的大小对学习效果有何影响？ Batch_size参数的作用：决定了下降的方向。极端一： batch_size为全数据集(Full Batch Learning)：好处：1.由全数据集确定的方向能够更好地代表样本总体，从而更准确地朝向极值所在的方向。2.由于不同权重的梯度值差别巨大，因此选择一个全...

2017-12-19 18:17:17 18797 1

原创 [论文笔记]TextBoxes A Fast Text Detector with a Single Deep Neural Network

TextBoxes A Fast Text Detector with a Single Deep Neural Network相比于ssd，创新点如下：1.改变生成的prior boxes的aspect ratios，改为1,2,3,5,7和10。并且设置了vertical offsets2.将３×３的卷积核改为1×５，改善了特征提取效果。3.测试阶段：将输入的i

2017-12-18 17:28:00 713

原创 [资料整理]将场景文字数据集ICDAR2013,ICDAR2015转换为PASCAL_VOC数据集格式

写在前面：常见的目标检测框架，如faster-rcnn，SSD等，一般都提供了对pascal_voc数据集的读取接口。而将目标检测的框架应用到场景文字检测上，往往可以取得不错的效果。那么，接下来，我就介绍一下，将几种常见的场景文字数据集，如ICDAR2013,ICDAR2015,ICDAR2017,coco-text等转换为pascal_voc数据集的方式。 1.ICDAR2013IC...

2017-12-16 21:11:45 13735 19

原创 [资料整理]场景文字检测资料

文字检测与识别资料目录个人主页数据库基本信息数据库功能数据库的论文和相关链接开源代码博客资源个人主页白翔，黄伟林，VGG，Lukas Neumann，金连文，刘成林，殷绪成，Hojin Cho数据库基本信息数据库功能数据库相关链接ICDAR2003paper：ICDAR 2003

2017-12-15 22:00:50 2171

原创 [资料整理]Caffe:GPU Optimization简介

CUDA(Compute Unified Device Architecture)，是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构ISA以及GPU内部的并行计算引擎。开发人员现在可以使用C语言来为CUDA™架构编写程序，所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行

2017-12-06 22:43:14 970

原创 [训练测试过程记录]SSD:Single Shot Detector 用于场景文字检测

介绍用SSD模型进行场景文字检测。举例数据集：COCO-Text。编译部分：1.使用cuda8编译时出错/usr/include/boost/property_tree/detail/json_parser_read.hpp:257:264: error: ‘type name’ declared as function returning an array

2017-12-01 19:20:00 4105 3