自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 浅谈Anchor-Free发展历程

1.早期探索:DenseBox: https://arxiv.org/abs/1509.04874YOLO: https://arxiv.org/abs/1506.026402.基于关键点:CornerNet: https://arxiv.org/abs/1808.01244ExtremeNet: https://arxiv.org/abs/1901.080433.密集预测:FSAF...

2019-04-18 20:46:44 24818 4

原创 单目标跟踪测试集总结

训练集:测试集:otb系列 官方下载链接:http://cvlab.hanyang.ac.kr/tracker_benchmark/datasets.html其中分为otb50和otb100[1]以otb50举例,图片来自官网:其中每类图下面类似于SV是其中每个视频序列存在的挑战性,具体为:IV: 光照变化——目标区域的光照发生了显著变化。SV: 比例变化——第一帧和当前帧的边框...

2019-12-15 13:58:12 1910 1

原创 2019研究生数模C题任务3,4相关信息

任务三视频转帧截图:实际地址为:可看到占地面积信息。任务四视频转帧截图:实际地址信息:参照信息:(最远端东迹大桥)大家可以简单做个参考。...

2019-09-23 18:55:36 976 2

原创 SiamDW论文作者张志鹏视频笔记

论文地址:https://arxiv.org/abs/1901.01660论文代码:https://github.com/researchmm/SiamDW视频地址:https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247488789&idx=2&sn=45be80a20b5aeebbd97d1184360c3...

2019-09-09 18:36:20 2466 6

原创 ILSVRC2015_VID数据集详解

数据集下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz总说:数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。每个snippet包括56~458帧图像不等。视频中的目标检测,类似目标检测任务的风格。该任务有30个基本类别,是目标检测任务200...

2019-08-30 14:06:28 12957 12

原创 如何理解Focal Loss

论文链接:https://arxiv.org/abs/1708.02002动机为了解决目标检测中正负样本比例严重失衡的问题,且能更关注于困难样本的学习,使得模型效果更鲁棒。从二分类交叉熵损失函数说起其中y’是经过激活函数后的输出值,常用激活函数sigmoid,故值范围为(0,1)分析损失函数,若是正样本,输出概率越大,损失越小;若是负样本,输出概率越小损失越小,但函数默认完全均...

2019-08-19 11:12:29 320

原创 CMAKE编译opencv_contrib扩展下载地址

opencv_contrib 版本一定要与opencv版本对应,很多博客给的GitHub引导到的opencv_contrib/modules在cmake编译时都会报错,原因就是版本不匹配opencv_contrib各版本下载地址:https://github.com/opencv/opencv_contrib/releases编译博客推荐:https://blog.csdn.net/liu79...

2019-08-06 22:35:31 133

原创 SiamRPN++阅读笔记

论文地址:https://arxiv.org/pdf/1812.11703.pdf代码地址:https://github.com/STVIR/pysot (截至博客发表前只能运行demo程序)前言:在所有效果较好的算法中,网络结构基本是基于AlexNet和VGG,深度学习作为当今潮流,人们喜欢将热门网络结构与自己领域相结合,但是为什么在前几年ResNet热度高居不下的情况下,依然没有人将R...

2019-05-23 16:32:40 3312 6

原创 简单数据库编写实例

1.安装MySQL2.创建数据库3.创建数据表4.插入数据5.修改数据1.安装MySQL(基于windows)安装包下载地址:http://dev.mysql.com/downloads/mysql/下载完后,我们将 zip 包解压到相应的目录配置 MySQL 的配置文件打开刚刚解压的文件夹 ,在该文件夹下创建 my.ini 配置文件,编辑 my.ini 配置以下基本信息:进...

2019-05-13 20:06:25 6641

原创 MySQL修改密码最有用命令

最近玩MySQL时需要修改命令,在网上找了很多种修改代码都显示错误,ERROR 1064(42000),报错代码表示语句有错。You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near ‘p...

2019-05-13 18:52:44 106

原创 云从科技:详解跨镜笔记

目录:ReID的定义及技术难点常用数据集与评价指标简介多粒度网络(MGN)的结构设计与技术实现应用场景与技术展望行人智能认知:行人检测,行人分割&背景替换,骨架关键点检测&姿态识别,行人跟踪/MOT,动作识别,行人属性结构化,跨镜追踪&行人再识别(ReID)ReID的定义:技术趋势:行人识别是继人脸识别后一个重要的研究方向人体对象:研究的对象是人的整个特...

2019-04-25 22:53:48 306

原创 SiamMask:Fast Online Object Tracking and Segmentation: A Unifying Approach

论文链接:https://arxiv.org/pdf/1812.05050.pdf前期铺垫:目标跟踪分类:1.预测 score 的方法这类算法以相关滤波和 SiameFC 为代表。通过预测候选区域的 score map来得到物体的位置,通常情况无法得到物体的长宽比变化。利用boundingbox regression比如SiamRPN,在预测正确的时候,会给出更为精确的 box。...

2019-04-25 19:50:24 289

原创 从RoI pooling到RoI Align

RoI pooling与RoI Align都是在感兴趣区域生成的feature map上下采样,使得固定输出特定尺寸(一般为7x7)的新的feature map,再进行后续的分类与框的回归。由于要进行框的回归,所以位置的准确度就尤为重要对于RoI pooling:1.从卷积网络feat_stride=32出来后,图片缩小为原图的1/32,比如原图为800x800,输出大小即为25x25。...

2019-04-17 14:53:36 313

原创 GOTURN网络学习笔记

2019-03-21 15:48:39 269

原创 Fully-convolutional siamese networks学习笔记

2019-03-21 15:42:28 416

原创 CNN系列学习(九):R-CNN系列

在图像分类识别之后,下一步学习图像目标检测,就是不仅识别出图片中的物体类别, 还要返回物体的位置。R-CNN系列就是完成的此项工作。首先看R-CNN的网络结构:其中关于图像分类工作是由预先的CNN网络训练而得,主要关注特征提取。它的思路的通过选择性搜索找到一系列的候选区域,然后将整个区域放入各个类的SVM判别器进行二分类,返回一个判别值即完成对候选框中目标的识别工作,最后需要的就是使用回归器...

2019-01-22 23:53:56 280

原创 CNN系列学习(八):DenseNet

论文链接:https://arxiv.org/pdf/1608.06993.pdf论文参考:https://blog.csdn.net/u014380165/article/details/75142664/核心思想:作者从feature入手,通过对feature的极致利用达到更好的效果和更少的参数。网络结构:可以看到,每一层的输入来自前面所有层的输出。下面表示DenseNet的结构图...

2019-01-22 23:18:41 231

原创 CNN系列学习(七):ResNet

论文链接:https://arxiv.org/abs/1512.03385在解决梯度消失和梯度爆炸的时候,我们提到过有一种解决思路使引入残差结构,下面具体介绍一下将这个结构与VGG模型结合后的ResNet。网络结构如下:在ResNet网络结构中会用到两种残差模块,一种是以两个3x3的卷积网络串接在一起作为一个残差模块,另外一种是1x1、3x3、1x1的3个卷积网络串接在一起作为一个残差模块...

2019-01-22 22:46:47 545

原创 CNN系列学习(六):GoogleNet

论文参考:https://blog.csdn.net/u011534057/article/details/54847992在AlexNet之后,为了使网络性能提升,除了像VGG一样增加网络的深度,用3x3的卷积层数组合增加感受野,类似替代5x5或者7x7的卷积之外,还有一类思路通过增加宽度,直接连接不同的卷积尺度后的特征图,达到特征学习的目的,即是GoogleNet做的事情。GoogleNe...

2019-01-22 21:55:06 231

原创 CNN系列学习(五):batchnorm

参考出处:https://blog.csdn.net/qq_25737169/article/details/79048516在上一篇关于解决梯度消失和梯度爆炸的介绍中提到了其中一种方法就是采用batchnorm,可译为批量规范化,这篇介绍就好好讲讲batchnorm的相关概念。就跟我们之前谈到,训练深度网络的时候经常发生训练困难的问题,原因是因为,每一次参数迭代更新后,上一层网络的输出数据经...

2019-01-22 15:38:29 1532

原创 CNN系列学习(四):梯度消失与梯度爆炸问题

借鉴出处:https://blog.csdn.net/raojunyang/article/details/79962665在前一篇学习心得中我们介绍了VGG模型,它是在AlexNet的基础上通过增加网络的深度,使感受野扩大,后层学习的语义信息提高,从而更好的进行图片的分类。当时我们有个思考,为何不直接将如此简洁的模型加到上百甚至上千层,那学习到的语义信息不是更丰富了吗,那个时候我们简单谈到了...

2019-01-22 13:57:29 7374

原创 CNN系列学习(三):VGG

论文原文下载:https://link.zhihu.com/?target=https%3A//arxiv.org/pdf/1409.1556.pdf上篇文章说到,当AlexNet出来之后,卷积神经网络的大致模型基本上就是卷积池化与全连接,而后面为了增强功能,站在前人的基础上后来者是各显神通,而VGG网络模型就是通过卷积层数的加深,来增加感受野,从而提升后层特征通道的语义信息,进行更宽更好的目标...

2019-01-22 12:54:32 394

原创 Windows下配置tensorflow

配置tensorflow我们选择在anaconda基础上进行安装首先安装anaconda,下载地址:https://www.anaconda.com/download/安装好之后,在左下角左键点开“开始”,“最近添加”里面点开Anaconda Prompt,记住用管理员身份运行配置步骤:1.将清华镜像放入list,命令行中键入conda config --add channels htt...

2018-12-29 16:58:05 260

原创 Targeted Dropout

论文下载地址:https://openreview.net/pdf?id=HkghWScuoQ码源:https://nips.cc/Conferences/2018/Schedule?showEvent=10941Targeted Dropout的提出,是想解决原本dropout可能丢失关键信息神经元的问题从dropout谈起:我们在前向传播的时候,让某些神经元的激活值以一定的概率p停止工...

2018-12-28 11:55:00 1225 2

原创 CNN系列学习(二):AlexNet

论文原文PDF下载在系列学习一的时候说到LeNet-5网络的最大贡献在于提出卷积-池化-全连接的概念,实现分类功能,而AlexNet可以说是第一个用它奠定的网络骨架实现一个比较复杂的分类工作的网络结构,而AlexNet网络结构的提出,使CNN被大家重新重视起来,并开始投入了大量精力去解决一系列的相关问题,而从时间和计算机的发展来看,起初限制深度学习发展的算力问题的解决,也是深度学习被重视起来一个...

2018-12-24 15:49:51 222

原创 CNN系列学习(一):LeNet-5

PDF下载LeNet-5网络是由LeCun等人在1998年提出,用于解决手写数字识别,由于提出了卷积与池化这一概念,为后来卷积神经网络的发展奠定了基调。网络结构如图:可以看到,网络输入是一个一维的32x32大小的图片,通过5x5的卷积核,经过6个特征通道,输出的到28x28x6的feature maps,通过2x2的下采样池化后图片大小降至14x14x6,然后用5X5的卷积核卷积的同时再将6...

2018-12-24 12:07:16 363

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除