PRIS-SCMonkey-CSDN博客

原创轻量级深度学习网络——ESPNet v2

作者介绍了一种轻量、效率高、通用的卷积神经网络ESPNet v2，用于对可视化数据和顺序数据进行建模。相比前一代网络，v2使用逐点群卷积和深度空洞可分离卷积。作者在四个不同的任务上使用该网络进行测试包括对象分类，语义分割，目标检测和语言建模，取得了优异与其他轻量级网络的效果。

2019-07-03 18:33:29 12661 6

原创目标检测——Mask R-CNN【请结合其他博客一起食用】

大家好今天来到了我们Maskrcnn 的分享由于MaskRCNN网络包含了很多之前介绍过的知识点，例如RPN，FPN，RoIPooling，RoIAlign，故这遍文章看上去显得比较‘单薄’，如果想弄清楚Mask RCNN网络，需要结合之前的博文一同食用~~ o(=•ェ•=)m 前言本篇论文其实还是分割为主，但是目前我们的网络基础是分类和检测，知识积累还不够，所以如有分割问题解释...

2019-03-22 17:07:10 8596 5

翻译【论文翻译】PSENet：Shape Robust Text Detection with Progressive Scale Expansion Network

Shape Robust Text Detection with Progressive Scale Expansion Network基于渐进式尺寸可扩展网络的形状鲁棒文本检测论文链接：https://arxiv.org/pdf/1806.02559.pdf论文代码：https://github.com/whai362/psenet【摘要】形状鲁棒性文本检测面临的挑战主要有两个方面：1...

2019-03-18 22:14:03 16358 8

文章目录0. 摘要1. 简介2. 基于空间金字塔池化的深度网络2.1 卷积层和特征图2.2 空间金字塔池化层2.3 网络的训练2.3.1 单一尺寸训练2.3.2 多尺寸训练3. 用于图像分类的SPP-NET3.1 ImageNet 2012分类实验3.1.1 基准网络架构3.1.2 多层次池化提升准确度3.1.3 多尺寸训练提升准确度3.1.4 全图像表示提升准确度3.1.5 特征图上的多视图测试...

2019-02-27 10:36:22 24221 25

原创 Opencv——RGB图像的通道拆分(cv2.split)与合并(cv2.merge)

之前分享了有关颜色空间（色彩空间）的总结，最初的想法是想把RGB图像的三个通道拆分开来，结果拆分过程比较曲折，所以写一篇博客记录下来，仅供参考。首先，我们可以利用opencv中的两个函数来拆分通道（cv2.split）和合并通道（cv2.merge），代码如下：import cv2img = cv2.imread('test.jpg') #opencv读取图像文件b...

2019-02-16 21:22:19 47015 6

原创深度学习网络篇——ResNet

ResNet作者：Kaiming He ，Xiangyu Zhang ，Shaoqing Ren ，Jian Sun研究机构：Microsoft ResearchAbout Kaiming He:2003年广东省理科高考状元，清华基础科学班，香港中文大学攻读研究生，微软亚研院实习，现在FAIR工作主要文献:ResNet，Faster-RCNN（Shaoqing Ren一作）, S...

2018-12-17 19:46:29 90951 34

原创所有的道别里，我最喜欢，明天见

正值毕业季，和我一起写博客的小伙伴们纷纷踏上了人生的新征程。所以我打开已经很久没有更新的博客，写下我对他们最珍重的思念和不愿当面说出口的再见。回首这三年的硕士生活，感觉第一次见面真的像是昨天才发生的事情。那时候什么还不懂的我们，一点点的学起，一起打比赛，一起写博客，一起在白洋淀唱过歌，一起在葫芦岛看过早上五点钟的太阳。我们就这样，从科研到生活，从北京到国内各地。我以为日子是这样一天一天过来的，当然也就应该一天一天这样过去。昨天、今天、明天本应该没有什么不同。但是，离别的时刻总是无可避免的到来了，就像每个

2021-06-23 16:18:42 1358 7

原创【杂七杂八的东西】ROSBAG：用python按时间戳提取bag中的图像

利用python在bag中提取带有时间戳的彩色图像和深度图像。

2021-03-07 17:45:45 6621 5

原创【Neural Style Transfer】Stroke Controllable Fast Style Transfer（含代码详解）

在介绍我们这次的论文之前，我们先来思考一些问题：在NST中，什么是风格图像中的风格信息？个人理解，风格图像中的风格信息指的是风格图像中的色彩、纹理、笔触等因素，这些因素的不同组合使得图像呈现出不同的风格信息。那么，再进一步的思考，我们怎样提取这些风格图像中的风格信息呢？在深度学习没有出现之前，大多数是利用图像处理和滤波来实现的，例如高斯滤波或者双边滤波；有了深度学习以后，开始从图像中提取高维的特征信息来表示风格信息，例如2015年Gatys提出利用Gram矩阵来表示图像中的风格信息，并且这一想法使

2020-09-24 13:48:25 1372

原创【杂七杂八的东西】Springer的LNCS_Latex踩坑篇

Springer的LNCS_Latex踩坑篇1. 通讯作者小信封符号的添加（Corresponding Author）2. 共同一作的注明3. 在LNCS中引用中文字符计算机学科的会议论文通常要求使用springer的LNCS的模板，也是根据博主的一点点经验给大家排一下坑，按需阅读与自取（当然，这是博主第一次投论文，很多问题会非常小白，也记录在了这里）。LNCS的模板主要有两种，一种是Latex版本，一种是Word版本，博主的个人经验是Latex版本会更加便捷，推荐Latex，虽然需要了解一下语言语法，

2020-08-08 21:41:30 25627 18

原创【Transfer Learning】Adversarial Discriminative Domain Adaptation

Adversarial Discriminative Domain Adaptation这篇论文正式发表于2017的CVPR，但在2017年的ICLR的Workshop中就已经展露了头角，主要详细的讨论了在Domain Adaptation（即DA领域）中将生成对抗的想法如何更好的融入进来，实现1+1>2的效果。按照惯例，我们先来看一下写这篇论文的大佬们和他们所属的机构。一作：Eric...

2020-07-01 10:23:25 2804 1

原创【CVPR2020】Fast Soft Color Segmentation

Fast Soft Color SegmentationSoft Color Segmentation 软颜色分割非常偶然的在胖圈看到有人推荐这篇CVPR2020的论文，Fast Soft Color Segmentation，感觉名字很有趣，本想在百度里面就可以百度到，结果…不过天无绝人之路，我竟然非常偶然的在b站看到了一个up主（一键三连嘛～Richard日常读paper）有分享过这篇论文的阅读并且成功蹭到了pdf，感动的留下了泪水，所以借花献佛也来和大家分享一下这篇论文。Soft Color Se

2020-06-22 11:11:13 2473 1

原创弱监督的语义分割论文汇总（持续更新ing）

弱监督的语义分割论文汇总弱监督语义分割导读弱监督语义分割论文整理基于Bounding box的弱监督语义分割基于Image-level labels的弱监督语义分割基于Scribbles的弱监督语义分割基于Points的弱监督语义分割弱监督语义分割导读一般认为，图像级的标注是弱标注（例如图像分类的类别标注），像素级的标注是强标注（例如分割标注的mask标注），对于普通的分割任务来说：数据是图像，标注是mask，这属于完全监督问题Supervised；如果标注是annotations或者图像级标注，

2020-05-27 11:30:55 7153 2

原创【Neural Style Transfer】Deep Photo Style Transfer（含代码详解）

2017CVPR: Deep Photo Style TransferAbstract 摘要Method 方法Background：Neural Style Algorithm by Gatys et al.Core idea：Photorealism RegularizationCore idea：Augmented style loss with semantic segmentationFinal Total Loss and Our ApproachResults and Comparison 结果

2020-05-26 16:37:06 2022 1

原创 Tensorflow——tf.cond()函数详解

最近在阅读大佬代码的时候遇到了一个比较令人困惑的函数tf.cond( )（控制数据流向），这里就拿出来和大家详解一下。TensorFlow 提供了几个操作和类可以用来控制操作的执行并向图中添加条件依赖关系，比如说tf.count_up_to()（对ref进行递增直到limit）和tf.case()（创建案例case）等，tf.cond()就是其中的一种。我们先来看一下tf.cond()在官方文档的定义（其实就已经比较好理解了，有些像if…else的感觉，控制数据流现在或者延迟流向下一个操作，个人理解，虽然

2020-05-22 13:29:35 5411

原创【CVPR2020】Semi-Supervised Semantic Image Segmentation with Self-correcting Networks

在本文中，介绍了一种有原则的半监督框架，该框架仅使用一小组完全监督的图像（具有语义分割标签和检测框标签：Boundingbox+mask）和一组仅具有对象边界框标签的图像（具有检测框标签：Boundingbox）。框架借助一个辅助模型（该模型为弱集生成初始分割标签）和一个自校正模块来训练主分割模型，该模块使用越来越精确的主模型在训练过程中改善了生成的标签。

2020-04-13 10:31:42 4674 12

原创【DA】Deep Visual Domain Adaptation: A Survey（持续更新ing）

1. DA Overview2. Approaches of Deep DA2.1 Categorization of One-step DA2.1.1 Discrepancy-based DA：基于差异的DA2.1.2 Adversarial-based DA：基于生成的DA2.1.3 Reconstruction-based DA：基于重构的DA2.2 Categorization of M...

2020-03-29 18:54:12 2496

原创【Transfer Learning】迁移学习的总体概述和阅读推荐（会持续更新）

推荐迁移学习入门的读物，包括论文、手册、山头、综述blabla的。

2020-03-25 22:15:34 5319

原创 Image.alpha_composite( )——实现一张背景透明图像和一张背景不透明图像的合成

题目可以说是非常的长了，因为我也找不到精简的语言来描述这个问题。我觉得我总会做一些奇奇怪怪的事情，但又觉得应该把它们记录下来，因为想法不实现真的很难受（请理解一下强迫症的重度患者）。在很多小伙伴没有ps的基础能力的情况下，想合成一张背景透明的图像和一张背景不透明的图像属实有些无从下手，所以在这里就给大家用python提供一些解决方案，先上图⬇️，分别是mask.jpg, image.jpg，fin...

2020-03-10 10:49:33 10909 3

原创 Keras操作小技巧（持续更新ing）

Part01 分类网络预测时如何设置Top-5：Keras.MetircsPart02 在训练过程中存储最好的权重模型：ModelCheckpointPart03 快速数据扩增数据集：ImageDataGeneratorKeras是用Python编写的高级神经网络API，能够在TensorFlow，CNTK或Theano之上运行。它的开发着眼于实现快速实验。这篇博客主要记录博主在Keras操作...

2020-03-03 12:09:21 862

原创 Win10+VScode+Latex快速上手：从安装到实操保姆级教程

1. 安装 MikTex2. 编辑器的安装3. Latex 工作环境的配置4. 如何快速套用模板5. 排版一篇论文必须掌握的操作(1) 导入必须的包(2) 插入图片(3) 插入表格(4) 插入公式(5) 添加引用这是一篇帮助论文 ddl 近在眼前但是完全没接触过 Latex 需要在半天之内快速上手实操的小伙伴们的经典干货文，根据这个定位呢，这篇博客不会有高深的 Latex 工作原理和高级操作，...

2020-02-24 11:29:16 4956 1

原创【oh-my-zsh】打造强大又美观的linux终端

Part 01——terminal, shell, bash的区别Part 02——zsh 和 oh-my-zshPart 03—— 安装oh-my-zshPart 04——更换oh-my-zsh主题Part 05——安装oh-my-zsh插件extractzsh-syntax-highlightingzsh-autosuggestionsPart 06——使用tips切换shell添加路径隐去...

2020-02-02 23:01:27 8416 7

原创【Transfer Learning】tSNE降维可视化

写在最前面：什么是tSNE？举个栗子：tSNE的Python实现最近接触了一个特别好用的看数据分布的可视化降维的方法——tSNE，但是也在这个坑里挣扎了非常久的时间，血与泪的经验是这是一个可视化的工具，只是一个可视化的工具，重要的还是数据和算法！！！现在准备收拾收拾暂时出坑了（说这句话的时候脑海里突然浮现出了《爱与不爱之间》，大家可以自行google或者百度或者脑补），把一些记录分享给大家。...

2020-01-28 22:34:12 6695 22

原创【Transfer Learning】Deep feature transfer between localization and segmentation tasks

忙里偷闲写一篇博客，因为实在是很久没有写博客了，内心觉得有一些内疚，我就是个这么乖巧的博主和小编（这么说我要开始催师弟们写博客了阿哈哈哈～）。我们进入正题，最近因为课题的原因，多多少少的接触了一些迁移学习的内容，就将一些学习笔记和内容记录下来。从Paper名字来看，这是一篇在定位和分割任务之间做深度特征迁移的，使用的也是分割的基础网络UNet，一个很基础的分割网络。这篇论文可在在Axiv【Pap...

2019-12-03 22:03:41 393

原创【python实战】append()函数的两三事

昨天，同实验室的善良可爱又nice的小姐姐coding的时候遇到了一个令人意想不到的bug（也可能是我们资历太浅），主题就是python中的append()函数，所以就把这个令人抓狂的过程记录下来，按需自取，用师弟的话来说就是 “战胜恐惧，微笑面对”。我们先来看一下append() 的基本操作：就是在list中添加元素或者一个新的list。那么举一反三，我们想在元素为list的list里a...

2019-11-07 22:37:45 2001

原创【杂七杂八的笔记】2019CVPR论文快读

2019年CVPR一共收到创纪录的5165篇有效投稿，比2018年的3309篇多出近2000篇，最终有1294篇论文被接收，最终录取率为25.2%。1294篇录取论文中，有288篇被录用为Oral论文。现在，距离2020年CVPR的截稿还剩整整一个月，在这种紧迫的时间里，2019CVPR的快读就处于比较尴尬的位置。但是无论怎样也用这篇博客预祝伙（大）伴（佬）们Paper都中！都中！全都中！！！附...

2019-10-15 21:45:11 1322

原创【字体风格迁移】Multi-Content GAN for Few-Shot Font Style Transfer

这篇论文发表于2018年的CVPR，是美国伯克利大学BAIR实验室和Adobe研究院一起合作的论文，都是大佬们啊。我们来瞻仰一下这两个实验室和作者大佬们。UC Berkeley BAIR实验室美国伯克利大学的BAIR实验室，全称是The Berkeley Artificial Intelligence Research Lab，主要致力于研究计算机视觉、机器学习、自然语言处理、策略和机器...

2019-09-18 15:56:49 3774

原创【Super Resolution】超分辨率——ESRGAN

1、ESRGAN的简单了解2、ESRGAN的网络结构3、ESRGAN中的判别器在上一篇文章【Super Resolution】超分辨率——SRGAN中，我们详细的介绍了SRGAN，那么是否SRGAN可以再进行改进呢？这就是ESRGAN，这篇论文主要探讨的问题就是如何在SRGAN上做改进，是网络在超分问题上有更好的表现。这篇论文在PIRM 2018-SR Challenge1中拿了第一名，然后论...

2019-09-09 12:09:45 6317

原创【Super Resolution】超分辨率——SRGAN

接触这篇paper的理由——据说这是第一篇将GAN应用到超分领域的论文。在SRGAN之前，个人认为，超分网络的本质Paper：Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network...

2019-08-27 20:42:39 7275 10

原创 Ubuntu16.04 安装TensorFlow-gpu版本

Ubuntu16.04安装TensorFlow-gpu版本1. 查看CUDA和Cudnn的版本2. 选取适合的TensorFlow-gpu版本3. 安装TensorFlow-gpu4. 测试TensorFlow-gpu是否安装成功5. 一些报错的解决方案5.1 numpy的版本过高5.2 选用的TensorFlow-gpu版本和CUDA/Cudnn版本不符Ubuntu16.04安装Tenso...

2019-08-02 17:29:32 2100 1

原创【Super Resolution】超分辨率——SRCNN

SRCNN01 闲聊——图像的超分辨率02 SRCNN——超分和DL的结合02-1 双三次插值02-2 SRCNN的网络结构02-3 Training 训练阶段03 EXPERIMENTS 实验阶段04 对于一些名词的理解SRCNN01 闲聊——图像的超分辨率在一切开始之前，先整体的介绍一下图像的超分辨率（Image Super Resolution）。图像的超分辨率从图像角度可以分为单张...

2019-07-30 14:13:15 4551

原创深度学习中的各种卷积总结

深度学习中的各种卷积总结在深度学习中，卷积是一个非常重要的概念，卷积也是卷积神经网络拥有良好的图像处理能力的关键。这篇文章将介绍一下不同类型的卷积，为了简单起见，本文只关注于二维的卷积。

2019-07-26 21:06:22 4384 3

翻译【论文翻译】SIXray : A Large-scale Security Inspection X-ray Benchmark

整体来说，本篇论文提出了一个x射线的数据集，其中有1,059,231张图像，含危险品六类，并提出了对于重叠图像类别不平衡的处理方法CHR。

2019-07-23 18:17:17 8811 17

原创【Super Resolution】超分辨率的总结——评价指标

SR常用的评价指标有两种，一种是PSNR（峰值信噪比），另一种是SSIM（结构相似性评价），这两种评价指标是SR中最基础的测量被压缩的重构图像质量的指标。（1）PSNR——峰值信噪比 Peak Signal-to-Noise RatioPSNR是信号的最大功率和信号噪声功率之比，来测量已经被压缩的重构图像的质量，通常以分贝（dB）来表示。PSNR指标越高，说明图像质量越好。PSNR=10∗l...

2019-07-09 15:43:31 11576 6

原创机器学习数据集篇——QMNIST数据集

我们在很久之前介绍过MNIST的测试集，详情参见博客：机器学习数据集篇——MNIST数据集。MNIST数据集是一个大型的手写体数字数据库，通常用于训练各种图像处理系统，也被广泛用于机器学习领域的训练和测试。MNIST数据库中的图像集是NIST（National Institute of Standards and Technology）的两个数据库的组合。MNIST作为机器学习非常基础的数据集，...

2019-06-05 16:46:03 3094

原创目标检测——SSD

我们知道Yolo的核心思想是将物体检测问题转化了单一的回归问题（之前的是分类和回归问题），而SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。在正式介绍SSD之前，我们先来看一下论文，了解了这篇论文之后，SSD的思路就会清晰很多。 Paper：Scalable Object Detection using DeepNeural Networks 论文：基于深度网...

2019-05-14 10:47:37 3241

原创 Github新手使用说明——新建仓库的各种尝试

近期实验室将一些之前的数据及拿出来重新整理用一下，所以想在github上发个仓库来供大家共享，所以开始接触Github的新建仓库，默默的写一篇博客来记录一下如何在Github上建立仓库并且附上使用说明。第一步，Github远程仓库的建立首先，要在Github上注册和登录，这一步就不详细说了。我们顺便来了解一下Github的基本概念：RepositoryGithub里面的“仓库”，也就...

2019-05-07 10:49:17 1815 3

原创随手记——运行TensorFlow代码几个问题

最近在跑TensorFlow的深度学习网络的代码，随手记一下碰到的bug，也是仅供参考。这篇博客是随时更新的，欢迎大家补充和提问！问题一简称：ValueError（Variable already exists）问题描述： ValueError: Variable epoch_number already exists, disallowed. Did you mean to set reu...

2019-04-24 18:26:10 224

原创目标检测——CornerNet

CornerNet是一个比较综合的目标检测论文，如果要详细看的话要补充好多的知识，所以像我们基础比较薄弱的看起来比较吃力，但是一点点慢慢来嘛，总有一些事情是可以坚持下去的，比如说…写博客。【Paper】CornerNet：Detecting Objects as Paired Keypoints...

2019-04-08 19:08:00 2912

原创目标检测——Focal Loss

【Paper】Focal Loss for Dense Object Detection1. Background of object detection首先我们回顾单阶段目标检测(One-Stage)是如何实现的：上图是YOLO的框架针对一张图片featuremap的变化，可以看到，网络输出的结果是对所有预设集合的分类与回归。总损失函数如下：(1)L(pi,ti)=1Ncls∑i...

2019-03-29 14:16:53 1191 1

Coco2014数据集资源.txt

答辩PPT(欧美杂志简约风格)

空空如也