DL
tangxiaohu1234
66666666
展开
-
xml 转换 --倾斜文本矩形框 (cx,cy,w,h,ang)到四个角坐标点(x1,y1,x2,y2,x3,y3,x4,y4)
程序实现了由倾斜文本矩形框 (cx,cy,w,h,ang)到四个角坐标点(x1,y1,x2,y2,x3,y3,x4,y4)的转换 ,由于现有xml格式不符合voc格式要求 ,故先读取读取.xml文件,提出 (cx,cy,w h,ang) 数据 ,再转换到(x1,y1,x2,y2,x3,y3,x4,y4)批量写入ang范围(-90~0~90),坐标系与hough 变换中的相同# coding...原创 2019-01-24 11:40:12 · 3772 阅读 · 14 评论 -
FCN与上采样
1、FCN详解2、计算机视觉中upsampling(上采样)的三种方式fcn中的上采样其实就是bilinear filtering,就是数字图像处理的二维插值。将特征图放大,然后用crop层剪去多余的部分,使其和ground truth有一样的尺寸以便计算各个像素的预测值。bilinear filtering可以用卷积的形式实现。和前面conv层不同,deconv中卷积核不是随机的,而是根据放...原创 2019-01-24 11:03:09 · 1285 阅读 · 0 评论 -
textboxes 网络结构详解
1、SSD网络结构Caffe代码 .prototxt中 :SSD的结构为conv1_1,conv1_2,conv2_1,conv2_2,conv3_1,conv3_2,conv3_3,conv4_1,conv4_2,conv4_3,conv5_1,conv5_2,conv5_3(512),(注意这是:textbox++ 中 13 are inherited from VGG-16.)fc...原创 2019-01-24 10:56:01 · 1173 阅读 · 0 评论 -
单词one-hot 编码 理解
每个单词与一个唯一的整数索引相关联, 然后将这个整数索引 i 转换为长度为N的二进制向量(N是词表大小),这个向量只有第 i 个元 素是 1,其余元素都为 0。用 python 实现单词级的 one-hot 编码重要理解samples = ['The cat sat on the mat.', 'The dog ate my homework.']results = np.zeros(sh...原创 2018-12-07 22:30:14 · 1223 阅读 · 0 评论 -
PixelLink 翻译理解
PixelLinkMost state-of-the-art scene text detection algorithms are deep learning based methods that depend on bounding box regression and perform at least two kinds of predictions: text/non-text cla...原创 2018-12-07 22:21:43 · 920 阅读 · 0 评论 -
论文笔记:Learning Region Features for Object Detection
先mark一下这位博主写的,写得很用心。感谢中心思想:继Relation Network实现可学习的nms之后,MSRA的大佬们觉得目标检测器依然不够fully learnable,这篇文章类似之前的Deformable ROI Pooling,主要在ROI特征的组织上做文章,文章总结了现有的各种ROI Pooling变体,提出了一个统一的数学表达式,藉由这个表达式,提出完全可学习,无人工设计...原创 2018-12-07 22:02:20 · 277 阅读 · 0 评论 -
DSSD论文阅读
DSSD : Deconvolutional Single Shot Detectorhttps://arxiv.org/pdf/1701.06659.pdfIntroductionDSSD主要是介绍了一种采用传统上下文的先进的通用目标检测方法We then augment SSD+Residual- 101 with deconvolution layers to introduce a...原创 2018-11-22 12:28:16 · 889 阅读 · 0 评论 -
基于 mask_rcnn 的舰船检测
最近想的idea 就发现有文章出来了,这世界真大,多多拜读吧均为水文,大牛请忽略paper1 INSHORE SHIP DETECTION BASED ON MASK R-CNN Shanlanhttps://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=85191231 、在maskrcnn的基础上加入了 soft-nms2、...原创 2018-11-22 12:27:18 · 4446 阅读 · 14 评论 -
[numpy]random.choice()随机选取内容
读代码看到这句 np.random.choice([i for i in images[:200] if not is_empty(i)], size = 8)https://www.kaggle.com/rackovic1994/convolutional-neural-network 概述:可以从...原创 2018-08-21 11:02:09 · 7689 阅读 · 0 评论 -
交叉熵在loss函数中使用的理解
关于交叉熵在loss函数中使用的理解交叉熵(cross entropy)是深度学习中常用的一个概念,一般用来求目标与预测值之间的差距。以前做一些分类问题的时候,没有过多的注意,直接调用现成的库,用起来也比较方便。最近开始研究起对抗生成网络(GANs),用到了交叉熵,发现自己对交叉熵的理解有些模糊,不够深入。遂花了几天的...转载 2018-08-01 12:00:05 · 891 阅读 · 0 评论 -
深度学习环境配置tensorflow+cuda9.1+cudnn-v7.1
首先是这次配置的所有软件: ubuntu16.04 anaconda3 tensorflow_gpu cuda9.1+cudnn-v7.1一、安装 Anaconda详细阅读下载此官网对应python版本的anaconda https://docs.anaconda.com/anaconda/faq#id5建立一个 conda 计算环境为了管理多个环境, 那...原创 2018-04-24 21:29:28 · 5322 阅读 · 0 评论 -
Pycharm使用加速技巧
1、使用中出现内存慢慢爆满的情况Pycharm的加载数据量空间是有限的,所以我们要合理的使用这些空间,比如我训练数据集中的数据的话,光数据图片就有100多G, Pycharm在加载一个工程时会把工程下所有目录路径过一遍,这会影响Pycharm的使用速度:1.加载项目太慢,陷入漫长的等待2.如果项目训练数据过大会报空间不足的错误如何解决这个问题呢?其实并不难搞定。首先在Pycharm文件预...原创 2019-05-13 21:31:38 · 6727 阅读 · 0 评论