自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Stay hungry, Stay foolish

通过别人的博文和论文,汲取知识,加上自己的理解又分析总结了一些细节,本着分享来帮助其他人的想法,形成了这些博客,希望更多的人对论文不同的解读出现在网上,百花齐放,方便大家更好的理解。

  • 博客(39)
  • 收藏
  • 关注

原创 论文:Region Proposal by Guided Anchoring 阅读笔记

一、论文(19)Region Proposal by Guided Anchoringhttps://arxiv.org/abs/1901.03278二、论文笔记1、背景(1)、原本的anchors 生成不够高效(2)、不同的问题需要预先定义不同的锚,但是anchor定义的不合适的话,可能会影响结(3)、为了维持极高的召回率,需要定义很多的anchor ,这会带来很大的...

2019-07-15 21:35:07 236

原创 论文:Relation Networks for Object Detection 阅读笔记

一、论文(17) Relation Networks for Object Detectionhttps://arxiv.org/abs/1711.11575code : https://github.com/msracver/Relation-Networks-for-Object-Detection二、论文笔记1、背景(1)、建模物体之间的关系对物体检测非常有益,但是...

2019-07-01 18:02:19 337

原创 论文:FCOS: Fully Convolutional One-Stage Object Detection 阅读笔记

一、论文(19)FCOS: Fully Convolutional One-Stage Object Detectionhttps://arxiv.org/abs/1904.01355code: https://tinyurl.com/FCOSv1二、论文笔记1、背景(1)、anchor-based 需要设置的超参数太多了,而且超参数很影响最后的结果(比如cascade ...

2019-06-23 16:31:55 592

原创 论文:Training Region-based Object Detectors with Online Hard Example Mining 阅读笔记

一、论文(19)Training Region-based Object Detectors with Online Hard Example Mininghttps://arxiv.org/abs/1604.03540二、论文笔记1、背景(1)、现存的网络的启发式方法和超参数需要花费很多时间去调。(2)、数据集的样本有很多简易样本,以及一小部分的困难样本。(3)、传统...

2019-06-22 18:04:47 219

原创 论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression 阅读笔记

一、论文(19)Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regressionhttps://arxiv.org/abs/1902.09630code:https://giou.stanford.edu二、论文笔记1、背景(1)、深度神经网络的优化,目前主要集中在网络结...

2019-06-21 23:00:16 240

原创 论文:Bag of Freebies for Training Object Detection Neural Networks

一、论文(19)Bag of Freebies for Training Object Detection Neural Networkshttps://arxiv.org/abs/1902.04103code: https://github.com/dmlc/gluon-cv二、论文笔记1、背景(1)、简单的有效的训练方式,就可以再不增加任何inference时间的情况下...

2019-06-20 17:48:11 347

原创 论文:Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization 阅读笔记

一、论文(16)Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localizationhttps://arxiv.org/abs/1610.02391code: https://github.com/ramprs/grad-cam/pytorch :https://github.com/jac...

2019-06-16 23:44:13 556

原创 论文:CBAM: Convolutional Block Attention Module 阅读笔记

一、论文(18)CBAM: Convolutional Block Attention Modulehttps://arxiv.org/abs/1807.06521code:gihub二、论文笔记1、背景1、网络结构方面有往深度方向探索的(使用resnet结构之后,网络可以更深),有往宽度方向探索的,比如(googlenet)还有往(cardinality)方向探索的...

2019-06-15 22:55:07 868

原创 论文:Text-Attentional Convolutional Neural Network for Scene Text Detection 阅读笔记

一、论文(16)Text-Attentional Convolutional Neural Network for Scene Text Detectionhttps://arxiv.org/abs/1604.02878二、论文笔记1、简介这是一篇关于图片是否包含文字区域的二分类的论文1、背景(1)、文字区域只占整个图片一个很小的区域,但是图片的背景相对复杂,这样就增加...

2019-06-14 12:06:36 803

原创 论文:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 阅读笔记

一、论文(16)Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networkshttps://arxiv.org/abs/1604.02878二、论文笔记1、背景(1)、没人把facedetection and alignment结合起来做,或者前面人做得效果不太好(2...

2019-06-13 16:12:46 220

原创 集成学习---综述

一、简介集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、基于委员会的学习(Committee-based learning)。这里的【学习器】就是指机器学习算法训练得到的假设。而我们之所以有直觉要把多个学习器组合在一起,是因为单个学习器往往可能效果不那么好 这要么是因为它们具有...

2019-06-11 11:31:10 1770

原创 集成学习---(Bagging) RandomForest

一、简介https://www.cnblogs.com/maybe2030/p/4585705.html鉴于决策树容易过拟合的缺点,随机森林采用多个决策树的投票机制来改善决策树,我们假设随机森林使用了m棵决策树,那么就需要产生m个一定数量的样本集来训练每一棵树,如果用全样本去训练m棵决策树显然是不可取的,全样本训练忽视了局部样本的规律,对于模型的泛化能力是有害的产生n个样本的方法采用B...

2019-06-11 11:29:40 374

原创 集成学习---(Boosting) Adaboost

一、简介1、 AdaBoost就是损失函数为指数损失的Boosting算法(当然这是后话,意思是指数损失的前向分步算法和Adaboost一致)二、细节1、算法流程2、最重要的两点误差率:==(也就是在一轮过后,误差率直接用分错样本的权重想加就可以了)(1)、弱分类器的权重如何确定权重仅仅由该分类器的分类误差率e决定,e的范围应该是[0, 0.5],所...

2019-06-11 11:27:44 412

原创 统计语言模型

详细见: https://www.cnblogs.com/peghoty/p/3857839.html1、介绍2、计算统计语言模型的参数的方法(1)、n-gram做了一个n-1介的马尔科夫假设,认为一个 词出现的概率只与它前面的n-1个词相关这样利用条件概率公式就可以统计计算了(2)、神经概率语言模型(基于n-gram的思想...

2019-06-09 20:03:00 541

原创 词编码

1、词集模型词集模型:将语料库的所有不相同的词,列出一个有顺序的列表,然后根据该顺序形成一个列表长度的向量,然后根据词列表的顺序,搜索句子里是否包含该词,包含的话向量的该位置置为1,否则置为0。缺点:向量的顺序完全根据前面形成的词的列表的顺序而来,与句子的词的顺序无关,忽略了文本的词序,以及没有词语的权重信息2、词袋模型在词集模型的基础上,把置1改为词出现的频率信息或者tf-idf...

2019-06-09 13:36:08 671

原创 论文:GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyond 阅读笔记

一、论文(19)GCNet: Non-local Networks Meet Squeeze-Excitation Networks and Beyondhttps://arxiv.org/abs/1904.11492code:https://github.com/xvjiarui/GCNet.二、论文笔记1、背景(1)、发现原版的non-local 结构针对每个查询位置...

2019-06-08 15:04:03 6570 2

原创 论文:Segmentation Is All You Need 阅读笔记

一、论文Segmentation Is All You Needhttps://arxiv.org/abs/1904.13300二、论文笔记1、基于RPN的方法对于图片里边一些特殊情况的物体的检测效果很差(召回率很差),比如这三种效果差主要有两个原因:(a)RPN高度依赖bounding box, 但是对于一些极端的例子,人工标注的ground truth ...

2019-05-30 17:32:01 930

原创 论文:Deformable ConvNets v2 阅读笔记

一、论文Deformable ConvNets v2: More Deformable, Better Resultshttps://arxiv.org/abs/1811.11168The code for DCNv2will be released.二、论文笔记1、背景a)、基于第一版的问题, 使用可变形卷积发现网络确实学会了适应物体的形状然后去关注不同形状物所覆盖的区...

2019-05-29 16:27:48 409

原创 论文:Feature Selective Anchor-Free Module for Single-Shot Object Detection 阅读笔记

一、论文Feature Selective Anchor-Free Module for Single-Shot Object Detectionhttps://arxiv.org/abs/1903.00621https://www.cnblogs.com/fourmi/p/10602936.html二、论文笔记1、背景a)、作者提出了一个FSAF网络结构块(feature...

2019-05-27 15:48:14 461

原创 论文:CornerNet: Detecting Objects as Paired Keypoints 阅读笔记

一、论文CornerNet: Detecting Objects as Paired Keypoints论文:https://arxiv.org/abs/1808.01244代码: https://github.com/princeton-vl/CornerNet二、笔记1、背景a)使用anchors的one stage 方法有两个缺点:(1)大量的anchor box 降...

2019-05-27 15:46:58 159

原创 论文:Parsing R-CNN for Instance-Level Human Analysis 阅读笔记

一、论文Parsing R-CNN for Instance-Level Human Analysishttps://arxiv.org/abs/1811.12596二、论文笔记1、分析以前的工作的问题实例级的人体分析还存在的问题(1)、mask 分支给出的是一个类无关的mask,但是实例分析需要更多的细节特征(2)、实例分析需要人体各个部分的几何和语义关系(ma...

2019-05-25 19:30:04 1736 1

原创 论文:Deep Face Recognition: A Survey 阅读笔记

一、论文Deep Face Recognition: A Surveyhttps://arxiv.org/abs/1804.06655二、论文笔记《 Deep Face Recognition: A Survey 》目前到v8分为人脸识别和人脸验证两种人脸验证: 1:1人脸识别: 1:N流程1、人脸检测(Face Detection)2、人脸对齐...

2019-05-25 19:21:52 2920

原创 论文:Cascade R-CNN: Delving into High Quality Object Detection 阅读笔记

一、论文Cascade R-CNN: Delving into High Quality Object Detectionhttps://arxiv.org/abs/1712.00726https://github.com/zhaoweicai/cascade-rcnn二、论文笔记1、背景a)、阈值设的太小,正负样本比例失衡,负样本太多,使得检测器对于有较大的阈值的错误框...

2019-05-25 19:15:11 242

原创 论文:CenterNet: Keypoint Triplets for Object Detection 阅读笔记

一、论文CenterNet: Keypoint Triplets for Object Detectionhttps://arxiv.org/abs/1904.08189code:https://github.com/Duankaiwen/CenterNet二、笔记1、背景1)、anchor-based方法anchor方法的复杂性2)、cornernet没有好好利...

2019-05-23 20:58:50 414

原创 ICLR 2019最佳论文:The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks

一、论文The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networkshttps://arxiv.org/abs/1803.03635二、论文笔记1、摘要:神经网络剪枝技术可将网络参数量减少 90%,进而在不牺牲准确率的前提下减少存储需求、提升推断的计算性能。然而现有经验表明,剪枝生成的解析架构从一开...

2019-05-17 14:34:02 4613 2

原创 论文:DensePose: Dense Human Pose Estimation In The Wild 阅读笔记

一、论文简介:基于密集点的一个姿态估计模型作者:本文主要是Facebook AI 和INRIA(法国国家信息与自动化研究所)联合出品效果:关键点对应 2d imageà3d surface coordinate(uv坐标)将2d图像的关键点映射成一个uv坐标,然后把这个uv坐标贴回到2d 的image上。难点:存在背景,遮挡,姿态,尺度的变化。应对这个问题之前的工...

2019-05-17 14:23:39 1116

原创 服务器安装SAMBA 供windows本地访问资源(centos windiws7)

作用:windows上的ide就可以在本地编辑服务器的文件(代码)了,直接保存就可以同步到linux上了1、预备工作在安装之前,或者启动服务之前需要将 服务器的防火墙,以及SELINUX( SELinux是一种基于 域-类型 模型(domain-type)的强制访问控制(MAC)安全系统)关闭# getenforce命令可以查看SElinux的状态 ,命令:# setenforce...

2018-11-10 13:26:39 2091 1

原创 linux/Centos 安装GTX-1080Ti 显卡 配置显卡驱动 cuda cudnn

os: centos 6.9显卡 :1080 TIcuda :cuda-10.0cudnn:cuDNN v 7.3.1CentOS 6.9安装NVIDIA GTX1080显卡驱动,直接说安装步骤和遇到的问题:一、安装驱动1:首先当然是要把驱动下载下来啦。我的电脑是NVIDIA的,所以自然先要访问其官网:http://www.geforce.cn/drivers 根据你自己的...

2018-10-14 21:06:23 3767

原创 caffe2 笔记

1、Caffe中LMDB的使用   https://blog.csdn.net/haluoluo211/article/details/544274212、Protubuf   Google Protocol Buffer( 简称 Protobuf) 是一种轻便高效的结构化数据存储格式https://www.ibm.com/developerworks/cn/linux/l-cn-gpb/i...

2018-07-19 10:14:46 240

原创 论文:Mask R-CNN 阅读笔记

一、简介Mask R-CNN是一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。整个Mask R-CNN算法的思路很简单,就是在原始Faster-rcnn算法的基础上面增加了FCN来产生对应的MASK分支。即Faster-rcnn + FCN,更细致的是 RPN + ROIAlign + Fast-rcnn + F...

2018-06-17 14:52:32 433

原创 论文:R-FCN: Object Detection via Region-based Fully Convolutional Networks 阅读笔记

一、简介1、R-FCN可以看做是Faster RCNN的改进版,速度上提高了差不多3倍左右,mAP也有一点提升,主要的目的是进行了加速2、当然这个算法还是属于候选窗+深度学习分类和回归系列的,也就是会包含rpn网络给出候选框建议。3、下面的这个表是共享参数的层数这篇讲解的很棒二、原理1、这篇论文是NIPS 2016的一篇论文,主要贡献在于解决了“分类网络的...

2018-06-16 17:12:46 364

原创 论文:Feature Pyramid Networks for Object Detection 阅读笔记

一、简介引用:http://hellodfan.com/2017/10/14/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-SSD%E5%92%8CFPN/二、流程在RPN+FAST R-CNN里边 嵌入FPN的流程图1、第一种不知是不是存在,与第二种的差别,就是最后的rol不是在不同的层级的feature ...

2018-06-16 00:00:59 1051

原创 2、LR-逻辑回归

一、细节1、逻辑回归(实际上应该叫对数机率回归),实际上是把线性回归只能做的回归问题转为分类问题线性回归问题是对给出的特征向量然后用权重向量与它相乘,最后得出的y值就是回归的值,而感知机则是设置一个阈值,对于输出的y值,大于阈值就是正类,小于它就是负类,而逻辑回归就是让输出的值等于几率的对数值,就是这个公式:2、看西瓜书3、逻辑回归假设数据服从伯努利分布(两点分布),通过极大化似然函数的方法,运用...

2018-06-15 14:31:17 429

原创 1、SVM

一、总体概览1,定义一个函数间隔2、这是几何间隔,真正的距离如果超平面参数w和b成比例的改变(超平面没有改变),几何间隔不变3、函数间隔和几何间隔的关系几何间隔因为除上了,使得在缩放w和b的时候几何间隔的值是不会改变的,它只随着超平面的变动而变动4、目的是求的最大间隔分离超平面因为现在的目标函数是二次的,约束条件是线性的,所以它是一个凸二次规划问题5、考虑到几何间隔和函数间隔的关系,可进行一下转换...

2018-06-15 14:22:46 308

原创 ResNet

2、深度残差网络——http://blog.csdn.net/twenty_seven/article/details/70153848这样的一个好处可能是当需要这个F(x)时,网络就会把他正常优化,当不需要这几层时,网络就会自动把它训练的趋近于0(相比于把他由非线性层拟合成恒等映射,变成0而另外直接添加一个恒等映射x会更容易),这样让网络来整体的自动选择一个最佳的网络的层数。那么实际的映射关系即...

2018-06-15 14:15:30 1413

原创 SPP-Net

一、简介主要贡献就是添加了金字塔层,可以应对不同大小的输入。二、过程1、首先通过选择性搜索,对待检测的图片进行搜索出2000个候选窗口。这一步和R-CNN一样。2、 特征提取阶段。这一步就是和R-CNN最大的区别了,这一步骤的具体操作如下:把整张待检测的图片,输入CNN中,进行一次性特征提取,得到feature maps,然后在feature maps中找到各个候选框的区域,再对各个候选框采用金字...

2018-06-15 13:46:48 256

原创 SSD

一、简介最大的改变就是综合了前面几层的特征,每层都生成输出值。1)SSD采用CNN直接进行检测,然而YOLO在全连接层之后进行检测;2)SSD提取的不同尺度的feature map来做检测,大尺度的特征图(靠前的特征图)用来检测比较小的物体(感受野小),而小尺度的特征图用来检测大物体(感受野大);3)SSD采用了不同尺度和不同长宽比的先验框(Prior Box ,Default Box,在fast...

2018-06-15 13:44:33 175

原创 YOLO v1

基本上看了别人的博客和论文,自己再总结一些细节。一 、yolo v1yolo 最重要的一个特点是划分格子,这个只是我们让网络自动适应学习的一个规则,实际上我们并不会在图像上进行划分,输入的时候,我们输入的还是一整张的图片。然后输出的的时候,是按预想的格子输出的,比如划分为7*7的格子,那我们最后的输出就是7*7*30。这样好像输出的每一个长条向量(30)好像就对应图像上划分的一个格子。实际上,最后...

2018-06-15 13:39:36 184

原创 Faster R-CNN

这三篇就够了引用1、http://shartoo.github.io/RCNN-series/2、http://hellodfan.com/2017/10/02/%E7%89%A9%E4%BD%93%E6%A3%80%E6%B5%8B%E8%AE%BA%E6%96%87-Faster-R-CNN/3、https://blog.csdn.net/hellor123/article/details/7...

2018-06-15 13:35:20 239

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除