![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 94
Shl_1024
本人菜鸟一只,博客用来记录学习和一些实验,以备以后之需。
展开
-
Ubuntu重装显卡驱动记录
原本使用CUDA9.0,想换成CUDA10.0,但是之前使用的驱动版本不匹配,重新配置,在此记录一下。配置教程参考:https://blog.csdn.net/qq_33200967/article/details/80689543安装时英伟达官网找旧版本驱动教程:https://blog.csdn.net/qq_40493763/article/details/107469539安装时注意:sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-ch原创 2020-10-16 10:54:34 · 256 阅读 · 0 评论 -
学习笔记18--SiamRPN
论文High Performance Visual Tracking with Siamese Region Proposal Network本文主要提出Siamese region Proposal Network(Siamese-RPN),包含siamese子网络用于特征提取,以及候选区域生成网络(region proposal subnetwork)用于分类和回归。一、先了解siam...原创 2020-03-08 21:26:25 · 1348 阅读 · 1 评论 -
学习笔记16
学习论文:Bridging the Gap Between Detection and Tracking: A Unified Approach动机:本文希望探索一种在几乎任何先进的目标检测器上直接构建跟踪器的一般框架。提出该动机的原因有3个方面:1)检测算法是专门在复杂场景中精确定位和区分对象的,这可能导致更准确和稳健的跟踪器。2)重用检测模型可以减少跟踪中的重复工作,因此我们可以将...原创 2020-02-23 21:26:11 · 522 阅读 · 0 评论 -
小结-语义分割
语义分割是将标签分配给图像中的像素。一、图像分类与语义分割不同点?池化层可以增加感受野,同时减少特征图的分辨率。这对于分类来说十分有效,其对象的空间位置无关重要,并能提取出更多抽象、突出的特征。然而,池化和带步长的卷积对语义分割是不利的,因为降低特征图分辨率意味着空间信息的丢失,如精确的边缘形状。因此语义分割提出的几种典型的网络都致力于恢复编码器中因降低分辨率而丢失的信息。二、语义分割...原创 2020-02-16 16:20:06 · 1038 阅读 · 0 评论 -
学习笔记15-ENet
ENet:A Deep Neural Network Architecture for Real-Time Semantic Segmentation.提出问题:深度神经网络在移动应用上进行实时像素级语义分割存在困难,需要大量的浮点运算,而且有很长的运行时间,这阻碍了其可用性。虽然CNN在图像分类等应用取得了巨大的成功,但CNN应用于图像像素级标注时只能提供粗糙的空间结果。然而,现有提出的用于...原创 2020-02-15 12:23:07 · 701 阅读 · 0 评论 -
学习笔记14——U-Net
论文学习:U-Net:Convolutional Networks for Biomedical Image Segmentation动机:在生物医学任务中无法获得数千张训练图像。之前提出训练滑窗网络来预测每个像素的标签方法,但存在以下两个缺点。1、很慢,由于网络必须在每个patch上分别运行,重叠的patch会导致大量的冗余。文中提出Overlap-tile策略改进。2、在定位准确和...原创 2020-02-13 09:35:32 · 456 阅读 · 0 评论 -
实验问题记录
caffe中运行R_FCN:1、ERROR: Could not install packages due to an EnvironmentError: [Errno 13] Permission denied: '/usr/local/lib/python3.5/dist-packages/easydict-1.9.dist-info'Consider using the `--user...原创 2020-01-11 21:09:28 · 288 阅读 · 0 评论 -
学习笔记十三——R-FCN
论文R-FCN:Object Detection via Region-based Fully Convolutional Networks学习总结提出问题:在使用AlexNet和VGG Nets网络时,由于其在设计上由两个子网络组成:一个卷积子网络以空间池化层结束,后面是几个全连接层。因此,在目标检测网络中自然地通过感兴趣区域RoI池化层进行划分,划分为两个子网络:(1)独立于RoI的共享“...原创 2020-01-04 21:37:42 · 335 阅读 · 0 评论 -
学习笔记十二——Deformable Convolutional Networks
一、提出问题视觉识别中一个关键挑战是如何在目标尺度,姿态,视点和部件变形中适应几何变化或建模几何变换,即适应物体的形变。现有解决方法:1)建立具有足够期望变化的训练数据集。例如通过仿射变换增加现有数据样本,即学习足够多的数据使模型能够适应各种形状的物体。2)使用变换不变的特征和算法。如SIFT(尺度不变特征变换)和基于滑动窗口的目标检测。存在的缺点:1)针对第一个解决方法,几何变换...原创 2019-12-28 21:14:12 · 443 阅读 · 0 评论 -
学习笔记十一——FPN
动机:识别不同尺度的目标是计算机视觉中的一个重大挑战。常用的解决方案是在图像金字塔之上建立特征金字塔,即特征化图像金字塔。图像金字塔对每个层次进行特征化,其主要优势在于它产生了多尺度的特征表示,所有层次都有很强的语义。但是如果应用到深度卷积网络上,需要大量的计算和内存。思路:本文利用ConvNet特征层级的金字塔形状,创建一个在所有尺度上都具有强大语义的特征金字塔。最终实现创建网络中的特征金字...原创 2019-12-21 21:14:24 · 462 阅读 · 0 评论 -
学习笔记十——Faster R-CNN
提出问题:在测试时候选区域提取耗费大量的时间。解决方法:用深度卷积神经网络计算候选区域,引入了新的候选区域网络(RPN),其共享目标检测网络的卷积层。Faster R-CNN:主要由两个模块组成:(1)候选区域的深度全卷积网络,(2)使用候选区域的Fast R-CNN检测器。1、Region Proposal Network (RPN)区域候选网络是为了提出候选区域的全卷积网络...原创 2019-12-14 21:16:26 · 645 阅读 · 0 评论 -
学习笔记九——SSD
The Single Shot Detector——SSD现有主流检测器之一,比Faster-RCNN更快,比YOLO有更高的mAP。该SSD检测方法借鉴以下思想:(1)YOLO中将检测转换成回归问题的思路。(2)基于anchor(Faster-RCNN)提出default boxes。(3)特征金字塔实现多尺度特征映射。改进之处:与faster rcnn不同,SSD没有生成 propos...原创 2019-12-07 21:22:14 · 303 阅读 · 0 评论 -
目标检测实践
目标检测的输入是一张图像,输出包括图像的类别、该图像所含的所有目标物体以及它们对应的位置。学习Google公司开源的TensorFlow Object Detection API的使用,在TensorFlow中进行目标检测。TensorFlow Object Detection API中实现了许多深度学习目标检测的框架,包括Faster R-CNN。一、安装TensorFlow Obj...原创 2019-11-30 21:26:03 · 374 阅读 · 0 评论 -
学习笔记八--YOLO9000
本周对YOLO的改进版进行学习,阅读论文YOLO9000:Better,Faster,Stronger,总结如下:论文主要介绍了:YOLO v2可以运行在多种分辨率下,可以达到一个速度和准确性之间的平衡。YOLO9000,是通过联合优化检测和分类可以检测 9000种目标类别,主要通过WordTree实现检测数据集与分类数据集的混合。提出一种新的联合训练算法,能同时在ImageNet...原创 2019-11-30 16:13:27 · 345 阅读 · 0 评论 -
学习笔记七--YOLO
本周主要阅读了论文You Only Look Once:Unified,Real-Time Object Detection,对该论文进行学习总结。文中提出了一种新的目标检测方法,称为YOLO。只需要在图像上看一次(YOLO),以预测出现的目标和位置。主要思想是将目标检测框架看作回归问题从空间上分割边界框和相关的类别概率。单个神经网络在一次评估中直接从完整图像上预测边界框和类别概率,可以进行端...原创 2019-11-23 21:46:00 · 1332 阅读 · 0 评论 -
学习笔记六-ThunderNet
本周看了论文ThunderNet:Towards Real-time Generic Object Detection,走向实时目标检测。是ICCV2019的一篇论文,在此做下总结。一、动机:在移动设备上实现实时通用目标检测。问题:移动设备在计算量方面会受到严格的限制,现有的基于CNN的检测器需要大量的计算量去实现理想的检测率,这会阻碍在移动场景下的实时推断。本文提出了一个轻量级两阶段...原创 2019-11-16 18:50:37 · 493 阅读 · 0 评论 -
学习笔记5-SENet
注意力和门机制:注意力将可用处理资源的分配偏向于输入信号的信息最丰富的组成部分。卷积核作为卷积神经网络的核心,通常被看做是在局部感受野上,将空间上(spatial)的信息和特征维度上(channel-wise)的信息进行聚合的信息聚合体。而本文提出专注于通道,并提出了一种架构单元,称之为“Squeeze-and-Excitation”(SE)块。动机:通过显式地建模通道之间的相互依赖关系,...原创 2019-11-09 21:05:33 · 656 阅读 · 0 评论 -
学习笔记4-inception v3
本周主要对论文Rethinking the Inception Architecture for Computer Vision进行学习,整理如下。一、动机之前Alex、VGGNet、googlenet网络方法的提出在分类领域取得了较高的性能,并且发现在分类性能上的收益可以转换成各种应用领域上的显著质量收益。相比于VGG和AlexNet,Inception方法的参数量有明显的降低,但是,单...原创 2019-11-02 19:58:07 · 823 阅读 · 0 评论 -
学习笔记3-BN-inception
论文Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift的学习记录。一、提出问题:Internal covariate shift内部协变量转移由于前面层的参数会发生变化,导致后面每层输入的分布在训练过程中同样会发生变化。这将要求较低的学习率和仔细的参数初始化减...原创 2019-10-25 20:07:25 · 1247 阅读 · 0 评论 -
TF学习笔记2 - 实现卷积神经网络
卷积神经网络和全连接神经网络的唯一区别是神经网络中相邻两层的连接方式。但在TensorFlow中训练一个卷积神经网络的流程和训练一个全连接神经网络没有任何区别。全连接神经网络来处理图像数据会出现参数增多导致速度变慢以及过拟合问题。一、卷积神经网络结构由输入层、卷积层、池化层、全连接层、softmax层1、卷积层过滤器:将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上...原创 2019-10-12 12:47:10 · 294 阅读 · 0 评论 -
学习笔记1 - ResNet网络学习
一些概念知识学习:端到端(end-to-end):指的是输入是原始数据,输出是最后结果。非端到端的输入端不是直接的原始数据,而是在原始数据中提取的特征。在以前是由手工提取图像的一些关键特征,称为降维,再利用提取好的特征进行实验。而随着数据量的增多,特征提取的复杂性增高,于是有了端到端网络,从原始数据中自己学习到特征。梯度消失/爆炸(vanishing/exploding gradien...原创 2019-10-12 09:49:58 · 1112 阅读 · 0 评论 -
Ubuntu16.04下深度学习环境配置
最近在Ubuntu16.04系统下配置了深度学习的环境,将配置的步骤和遇到的问题以及解决方法记录一下。搭建的环境版本搭配是Ubuntu16.04+显卡GTX1060+nvidia-384+anaconda4.2.0+cuda-9.0+cudnn-7.1.4+tensorflow-1.9.0这里需要注意各版本之间的对应关系,否则会出错。一、安装NVIDIA显卡驱动直接在Softwar...原创 2019-10-04 13:01:06 · 1113 阅读 · 0 评论 -
TF学习笔记1
一、关于TensorFlow的基本概念TensorFlow的计算模型、数据模型、运行模型,主要是一些理论概念的整理。1、TensorFlow的计算模型——计算图Tensor—张量,即可简单理解为多维数组,表明其数据结构。Flow—流,直观的表达了张量之间通过计算相互转化的过程,体现其计算模型。TensorFlow—一个通过计算图的形式来表述计算的编程系统,TensorFlow中...原创 2019-04-05 15:45:19 · 219 阅读 · 0 评论