Shl_1024-CSDN博客

原创 Ubuntu重装显卡驱动记录

原本使用CUDA9.0，想换成CUDA10.0，但是之前使用的驱动版本不匹配，重新配置，在此记录一下。配置教程参考：https://blog.csdn.net/qq_33200967/article/details/80689543安装时英伟达官网找旧版本驱动教程：https://blog.csdn.net/qq_40493763/article/details/107469539安装时注意：sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-ch

2020-10-16 10:54:34 279

原创学习笔记18--SiamRPN

论文High Performance Visual Tracking with Siamese Region Proposal Network本文主要提出Siamese region Proposal Network（Siamese-RPN），包含siamese子网络用于特征提取，以及候选区域生成网络(region proposal subnetwork)用于分类和回归。一、先了解siam...

2020-03-08 21:26:25 1395 1

原创学习笔记16

学习论文：Bridging the Gap Between Detection and Tracking: A Unified Approach动机：本文希望探索一种在几乎任何先进的目标检测器上直接构建跟踪器的一般框架。提出该动机的原因有3个方面：1）检测算法是专门在复杂场景中精确定位和区分对象的，这可能导致更准确和稳健的跟踪器。2）重用检测模型可以减少跟踪中的重复工作，因此我们可以将...

2020-02-23 21:26:11 551

原创小结-语义分割

语义分割是将标签分配给图像中的像素。一、图像分类与语义分割不同点？池化层可以增加感受野，同时减少特征图的分辨率。这对于分类来说十分有效，其对象的空间位置无关重要，并能提取出更多抽象、突出的特征。然而，池化和带步长的卷积对语义分割是不利的，因为降低特征图分辨率意味着空间信息的丢失，如精确的边缘形状。因此语义分割提出的几种典型的网络都致力于恢复编码器中因降低分辨率而丢失的信息。二、语义分割...

2020-02-16 16:20:06 1066

原创学习笔记15-ENet

ENet:A Deep Neural Network Architecture for Real-Time Semantic Segmentation.提出问题：深度神经网络在移动应用上进行实时像素级语义分割存在困难,需要大量的浮点运算，而且有很长的运行时间，这阻碍了其可用性。虽然CNN在图像分类等应用取得了巨大的成功，但CNN应用于图像像素级标注时只能提供粗糙的空间结果。然而，现有提出的用于...

2020-02-15 12:23:07 715

原创学习笔记14——U-Net

论文学习：U-Net:Convolutional Networks for Biomedical Image Segmentation动机：在生物医学任务中无法获得数千张训练图像。之前提出训练滑窗网络来预测每个像素的标签方法，但存在以下两个缺点。1、很慢，由于网络必须在每个patch上分别运行，重叠的patch会导致大量的冗余。文中提出Overlap-tile策略改进。2、在定位准确和...

2020-02-13 09:35:32 467

原创实验问题记录

caffe中运行R_FCN：1、ERROR: Could not install packages due to an EnvironmentError: [Errno 13] Permission denied: '/usr/local/lib/python3.5/dist-packages/easydict-1.9.dist-info'Consider using the `--user...

2020-01-11 21:09:28 323

原创学习笔记十三——R-FCN

论文R-FCN:Object Detection via Region-based Fully Convolutional Networks学习总结提出问题：在使用AlexNet和VGG Nets网络时，由于其在设计上由两个子网络组成：一个卷积子网络以空间池化层结束，后面是几个全连接层。因此，在目标检测网络中自然地通过感兴趣区域RoI池化层进行划分，划分为两个子网络：（1）独立于RoI的共享“...

2020-01-04 21:37:42 345

原创学习笔记十二——Deformable Convolutional Networks

一、提出问题视觉识别中一个关键挑战是如何在目标尺度，姿态，视点和部件变形中适应几何变化或建模几何变换，即适应物体的形变。现有解决方法：1）建立具有足够期望变化的训练数据集。例如通过仿射变换增加现有数据样本，即学习足够多的数据使模型能够适应各种形状的物体。2）使用变换不变的特征和算法。如SIFT（尺度不变特征变换）和基于滑动窗口的目标检测。存在的缺点：1）针对第一个解决方法，几何变换...

2019-12-28 21:14:12 452

原创学习笔记十一——FPN

动机：识别不同尺度的目标是计算机视觉中的一个重大挑战。常用的解决方案是在图像金字塔之上建立特征金字塔，即特征化图像金字塔。图像金字塔对每个层次进行特征化，其主要优势在于它产生了多尺度的特征表示，所有层次都有很强的语义。但是如果应用到深度卷积网络上，需要大量的计算和内存。思路：本文利用ConvNet特征层级的金字塔形状，创建一个在所有尺度上都具有强大语义的特征金字塔。最终实现创建网络中的特征金字...

2019-12-21 21:14:24 479

原创学习笔记十——Faster R-CNN

提出问题：在测试时候选区域提取耗费大量的时间。解决方法：用深度卷积神经网络计算候选区域，引入了新的候选区域网络（RPN），其共享目标检测网络的卷积层。Faster R-CNN：主要由两个模块组成:(1)候选区域的深度全卷积网络，(2)使用候选区域的Fast R-CNN检测器。1、Region Proposal Network (RPN)区域候选网络是为了提出候选区域的全卷积网络...

2019-12-14 21:16:26 665

原创学习笔记九——SSD

The Single Shot Detector——SSD现有主流检测器之一，比Faster-RCNN更快，比YOLO有更高的mAP。该SSD检测方法借鉴以下思想：（1）YOLO中将检测转换成回归问题的思路。（2）基于anchor（Faster-RCNN）提出default boxes。(3)特征金字塔实现多尺度特征映射。改进之处：与faster rcnn不同，SSD没有生成 propos...

2019-12-07 21:22:14 330

原创目标检测实践

目标检测的输入是一张图像，输出包括图像的类别、该图像所含的所有目标物体以及它们对应的位置。学习Google公司开源的TensorFlow Object Detection API的使用，在TensorFlow中进行目标检测。TensorFlow Object Detection API中实现了许多深度学习目标检测的框架，包括Faster R-CNN。一、安装TensorFlow Obj...

2019-11-30 21:26:03 404

原创学习笔记八--YOLO9000

本周对YOLO的改进版进行学习，阅读论文YOLO9000:Better,Faster,Stronger，总结如下：论文主要介绍了：YOLO v2可以运行在多种分辨率下，可以达到一个速度和准确性之间的平衡。YOLO9000，是通过联合优化检测和分类可以检测 9000种目标类别，主要通过WordTree实现检测数据集与分类数据集的混合。提出一种新的联合训练算法，能同时在ImageNet...

2019-11-30 16:13:27 373

原创学习笔记七--YOLO

本周主要阅读了论文You Only Look Once:Unified,Real-Time Object Detection，对该论文进行学习总结。文中提出了一种新的目标检测方法，称为YOLO。只需要在图像上看一次（YOLO），以预测出现的目标和位置。主要思想是将目标检测框架看作回归问题从空间上分割边界框和相关的类别概率。单个神经网络在一次评估中直接从完整图像上预测边界框和类别概率，可以进行端...

2019-11-23 21:46:00 1347

原创学习笔记六-ThunderNet

本周看了论文ThunderNet:Towards Real-time Generic Object Detection,走向实时目标检测。是ICCV2019的一篇论文，在此做下总结。一、动机：在移动设备上实现实时通用目标检测。问题：移动设备在计算量方面会受到严格的限制，现有的基于CNN的检测器需要大量的计算量去实现理想的检测率，这会阻碍在移动场景下的实时推断。本文提出了一个轻量级两阶段...

2019-11-16 18:50:37 521

原创学习笔记5-SENet

注意力和门机制:注意力将可用处理资源的分配偏向于输入信号的信息最丰富的组成部分。卷积核作为卷积神经网络的核心，通常被看做是在局部感受野上，将空间上（spatial）的信息和特征维度上（channel-wise）的信息进行聚合的信息聚合体。而本文提出专注于通道，并提出了一种架构单元，称之为“Squeeze-and-Excitation”（SE）块。动机：通过显式地建模通道之间的相互依赖关系，...

2019-11-09 21:05:33 686

原创学习笔记4-inception v3

本周主要对论文Rethinking the Inception Architecture for Computer Vision进行学习，整理如下。一、动机之前Alex、VGGNet、googlenet网络方法的提出在分类领域取得了较高的性能，并且发现在分类性能上的收益可以转换成各种应用领域上的显著质量收益。相比于VGG和AlexNet，Inception方法的参数量有明显的降低，但是，单...

2019-11-02 19:58:07 851

原创学习笔记3-BN-inception

论文Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift的学习记录。一、提出问题：Internal covariate shift内部协变量转移由于前面层的参数会发生变化，导致后面每层输入的分布在训练过程中同样会发生变化。这将要求较低的学习率和仔细的参数初始化减...

2019-10-25 20:07:25 1302

原创学习笔记2 - GoogLeNet

赫布理论：突触前神经元向突触后神经元的持续重复的刺激，可以导致突触传递效能的增加。在人工神经网络中，突触间传递作用的变化被映射成神经元网络图中相应权重的变化。如果两个神经元同步激发，则它们之间的权重增加；如果单独激发，则权重减少。其中w是从神经元 j 到神经元 i 的联接权重，x是神经元的输入。作者提到对于MNIST等数据集，卷积神经网络通常有标准结构——堆叠的卷积层（后面可以选择有对比归...

2019-10-17 23:05:45 314

原创 TF学习笔记2 - 实现卷积神经网络

卷积神经网络和全连接神经网络的唯一区别是神经网络中相邻两层的连接方式。但在TensorFlow中训练一个卷积神经网络的流程和训练一个全连接神经网络没有任何区别。全连接神经网络来处理图像数据会出现参数增多导致速度变慢以及过拟合问题。一、卷积神经网络结构由输入层、卷积层、池化层、全连接层、softmax层1、卷积层过滤器：将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上...

2019-10-12 12:47:10 327

原创学习笔记1 - ResNet网络学习

一些概念知识学习：端到端(end-to-end)：指的是输入是原始数据，输出是最后结果。非端到端的输入端不是直接的原始数据，而是在原始数据中提取的特征。在以前是由手工提取图像的一些关键特征，称为降维，再利用提取好的特征进行实验。而随着数据量的增多，特征提取的复杂性增高，于是有了端到端网络，从原始数据中自己学习到特征。梯度消失/爆炸(vanishing/exploding gradien...

2019-10-12 09:49:58 1139

原创 Ubuntu16.04下深度学习环境配置

最近在Ubuntu16.04系统下配置了深度学习的环境，将配置的步骤和遇到的问题以及解决方法记录一下。搭建的环境版本搭配是Ubuntu16.04+显卡GTX1060+nvidia-384+anaconda4.2.0+cuda-9.0+cudnn-7.1.4+tensorflow-1.9.0这里需要注意各版本之间的对应关系，否则会出错。一、安装NVIDIA显卡驱动直接在Softwar...

2019-10-04 13:01:06 1128

原创 TF学习笔记1

一、关于TensorFlow的基本概念TensorFlow的计算模型、数据模型、运行模型，主要是一些理论概念的整理。1、TensorFlow的计算模型——计算图Tensor—张量，即可简单理解为多维数组，表明其数据结构。Flow—流，直观的表达了张量之间通过计算相互转化的过程，体现其计算模型。TensorFlow—一个通过计算图的形式来表述计算的编程系统，TensorFlow中...

2019-04-05 15:45:19 248

原创手机平台应用开发实验

使用抽象activity托管fragment为CrimeListActivity创建视图，通用的布局定义文件<FrameLayout android:id="@+id/fragment_container" xmlns:android="http://schemas.android.com/apk/res/android" android:la...

2018-06-21 16:02:28 263

原创 Android编程-手机平台应用开发实验

1、开发一个名为CriminalIntent的应用。该应用可详细记录在办公室的陋习，该记录包括标题、日期和照片，以及支持在联系人中查找当事人。2、引入fragment来管理应用UI，gragment是一种控制器对象，activity可以委派它执行任务，这些任务通常是管理用户界面，这种管理用户界面的fragment即为UI fragment。3、使用fragment需要AppCompat，项目需要将...

2018-06-21 15:55:49 908

原创 Android编程-activity间的数据传递

activity间的数据传递——使用intent extra在QuizActivity和CheatActivity之间进行数据传递。使用以下语句的返回值通知CheatActivity当前问题的答案mQuestionBank[mCurrentIndex].isAnswerTrue()将该值作为extra信息，附加在传入startActivity(Intent)方法的Intent上发送出去。1）添加e...

2018-06-21 15:53:49 256

原创 Android编程-activity

一、创建activity创建新的activity需要：Java类、XML布局和应用的manifest文件。建议使用Android Studio的新建activity向导功能1）为activity定义布局组件<?xml version="1.0" encoding="utf-8"?><LinearLayout xmlns:android="http://schemas.androi...

2018-06-21 15:46:03 377

转载深入探究connect函数

QObject::connect函数的学习信号槽机制与Windows下消息机制类似，消息机制是基于回调函数，Qt中用信号与槽来代替函数指针，使程序更安全简洁。信号和槽机制是 Qt 的核心机制，可以让编程人员将互不相关的对象绑定在一起，实现对象之间的通信。（1）信号：当对象改变其状态时，信号就由该对象发射 (emit) 出去，而且对象只负责发送信号，它不知道另一端是谁在接收这个信号。这样就做到了真正...

2017-06-04 21:43:40 705

转载 c++类的静态成员，构造函数

静态成员是处理同一个类的不同对象之间数据和函数共享问题的。1.静态数据成员我们所说的“一个类的所有对象具有相同的属性”是指实例属性，以非静态数据成员表示，如Employee中的empNo.id.它们在类的每一个对象中都具有一个复本，是每个对象区别于其他对象的特征。如果某个属性为整个类所共有（如：雇员总数）不属于任何一个具体对象，则采用static关键字来声明为静态成员。静态成员在每

2017-03-31 15:17:26 3458

转载 Windows编程

记录实验中学习的使用Win32 API写程序的一些基础知识和参考资料。首先什么是API？API(Application Programming Interface,应用程序编程接口)是一套用来控制Windows的各个部件(从桌面的外观到位一个新进程分配的内存)的外观和行为的一套预先定义Windows函数.用户的每个动作都会引发一个或几个函数的运行以Windows告诉发生了什么，它们包含在一个附加名...

2017-03-03 14:32:52 374

Shl_1024的博客