Shadownow-CSDN博客

原创目标检测学习笔记12——Yolo系列梳理学习

文章目录一、Yolov11.检测框架2.网络实现3.训练阶段4.损失函数5.测试阶段6.缺点一、Yolov11.检测框架如下图所示，很简单，输入图像，经过一个网络，最终直接输出检测框的位置和类别，经过NMS处理后得到最终的目标检测结果。2.网络实现卷积层提取特征，全连接层去进行预测和输出分类概率和坐标。使用GoogleNet模型进行图片分类预训练。有24层卷积层，后接2个全连接层。不用GoogleNet中所使用的inception module，直接在1×1的reduction layer

2022-01-22 00:33:37 4204 2

原创目标检测学习笔记11——FPN学习与论文解读

文章目录一、引言二、结构对比三、实现细节四、实验结果一、引言论文链接：https://arxiv.org/abs/1612.03144FPN：Feature Pyramid Network。从名称可看出，是对特征图进行一个“金字塔”的处理。目标是利用卷积网络的金字塔特征层次结构，它具有从低到高的语义，并构建一个从头到尾都具有高级语义的特征金字塔。论文中提到recent deep learning object detectors have avoided pyramidrepresenta

2022-01-20 22:37:42 3076

原创 RuntimeError:one of the variables needed for gradient computation has been modified by an inplace

报错内容RuntimeError:one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [128, 64, 8, 8]], which is output 0 of ReluBackward0, is at version 1; expected version 0 instead. Hint: enable anomaly det

2021-12-13 22:39:36 1880 2

原创目标检测学习笔记10——Fast-RCNN学习与论文解读

一、引言Fast R-CNN发表于2015年，是一种基于卷积神经网络做目标检测的算法，它是建立在之前R-CNN的基础上使用深度卷积神经网络进行高效的目标检测。R-CNN的缺点：测试速度慢训练速度慢训练所需空间大（因为每张图片所提取的特征向量都需要存储在硬盘之中）训练是多阶段的：首先使用log loss 在目标建议（object proposal）上微调ConvNet；然后让 SVM 适应 ConvNet 的特征；最后训练 bounding-box regressor。使用VGG16网络在

2021-09-13 10:18:05 605

原创目标检测学习笔记9——RCNN学习与论文解读

一、引言RCNN是一个用来做目标检测和语义分割的神经网络。同时是两阶段目标检测方法的开山之作。所谓两阶段目标检测是指：先从输入图像中提取出候选框，然后对候选框进行分类识别。

2021-09-07 00:19:42 525

原创目标检测学习笔记8——AlexNet学习与论文解读

一、引言AlexNet是2012年ImageNet图像分类竞赛冠军。首次将卷积神经网络CNN和深度学习DL用于大规模图像分类。性能优异，相比之前获得巨大飞跃，是后续一系列优秀网络的奠定者。创新点：CNNReLU双GPU模型并行LRN局部响应归一化重叠最大池化数据增强Dropout正则化二、摘要训练了一个大而深的卷积神经网络去分类ImageNet2010年比赛1千200万张1000个类别的高分辨率图像。实现top-1的37.5%错误率和top-5的17.0%错误率。比之前最高水平

2021-08-26 12:54:08 758

原创目标检测学习笔记7——GoogleNet学习与论文解读

文章目录一、引言二、Inception结构1.原始版本2.降维版本3.两个版本参数比较4. 1×1卷积的作用三、GoogleNet网络结构1.前几层2.辅助分类器四、总结一、引言GoogleNet是2014年分类任务与检测任务的冠军得主。设计的初衷是为了提高在网络里面的计算资源的利用率。该网络权衡了算法效率即精确率和内存占用。众所周知，获得高质量模型最保险的做法是：增加模型深度（层数）或宽度（层核或神经元个数），但一般情况下，更深或更宽的网络会出现：参数过多，易过拟合；若训练集有限，这个问题

2021-08-22 22:53:50 567

原创目标检测学习笔记6——VGG学习与论文解读

文章目录一、引言二、网络结构三、VGG论文重点解读1.结构2.训练过程3.实验4.dense evaluation 与multi-crop evaluation两种预测方法的区别以及效果一、引言在学习ResNet神经网络时，提到VGG神经网络，因此对此展开学习。VGG网络在2014年ImageNet图像分类竞赛中获得亚军（当年的冠军是GoogleNet）、定位竞赛获得冠军。VGG最大的贡献就是证明了卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用。创新点：用多层

2021-08-16 11:21:09 1789 1

原创目标检测学习笔记5——Yolo3 YOLOv3: An Incremental Improvement

https://arxiv.org/abs/1804.02767

2021-08-11 10:19:33 393

原创目标检测学习笔记4——Yolo2 Yolo2论文解读

Yolo 21.引言2.Better2.1 Batch Normalization2.2 High Resolution Classifier2.3 Convolutional With Anchor Boxes2.4 Dimension Clusters2.5 Direct location prediction2.6 Fine-Grained Features2.7 Multi-Scale Training2.8 high resolution3.Faster3.1 Darknet-193.2 训练分类

2021-08-10 17:34:55 725

原创目标检测学习笔记3——Yolo1 Yolo论文解读

文章目录1.引言2.Yolo v1论文摘要1.介绍2.一个统一的目标检测框架1.引言Yolo1,2,3的作者是Joseph Redmon.Yolo是one-stage算法，即无需提取候选框、没有复杂的上下游处理工作，而是图片输入后经过网络，一次性往前推段得到bounding box的定位以及分类结果。是端到端训练优化。优点：将目标检测问题当作回归问题，无需提取候选框，是单阶段的。速度快。可以捕捉上下文信息，recall高、迁移泛化好缺点：4. 小物体检测效果差5. localiz

2021-08-09 16:38:36 1291 1

原创目标检测学习笔记2——ResNet残差网络学习、ResNet论文解读

一、前言在学习Yolo v3的过程中，了解到它借鉴了残差网络的快捷链路（shortcut connection），因此为了更好的理解yolo3，我对ResNet展开了学习，并阅读其论文。ResNet—— Residual Network残差神经网络，是何恺明大神（Faster RCNN的作者）于2015年提出，在当年多个大赛中用此网络获得了第一名。为什么会提出ResNet?在深度神经网络中存在一个问题，大家都知道，网络层数加深，参数增多，网络表现能力理应更好。但随着深度的不断增加，会出现网络退

2021-08-09 10:19:44 4100 3

原创解决方法：Makefile:77: recipe for target ‘darknet‘ failed make: *** [darknet] Error 1

想使用opencv运行yolo3，修改opencv=1后，make文件时报出了错误如下。搜了很多解决办法，大家注意不要只看标题的错误，要去看具体是什么错误。理性分析我这个错误后，发现是cuda的问题，于是我在安装了cuda9.0后，问题即可解决了！/usr/bin/ld: warning: libcudart.so.9.0, needed by /usr/local/lib/libopencv_core.so, not found (try using -rpath or -rpath-link)/u

2021-07-26 16:26:42 1789

原创代码调试问题记录

1.conv2d_v2() got an unexpected keyword argument ‘filter’把filter改成filters2.tf.placeholder() is not compatible with eager execution在文件前面加：tf.compat.v1.disable_eager_execution()3.TypeError: dropout_v2() got an unexpected keyword argument ‘keep_prob’

2021-07-22 15:05:23 3367 8

原创目标检测学习笔记1

目标检测学习笔记计算机视觉有四大基本任务，分别是：分类、定位、检测、分割。其中分类任务是所有任务的基础。因为对于一幅图像，可能含有多个物体。所以分类任务是对图像中主体事物类别的判断。定位任务也是单目标任务，和分类任务唯一的不同是，不仅需要分类还需要把判别出的主体事物的边界框出来。目标检测是多目标任务，是对图像中各种需要检测的物体如果出现用边界框框住，并判别其类别。分割任务和检测任务的区别就在于是框的形状是物体的边界形状。目标检测目的：从图像或视频流中，检测出其中一个或多个物体的类别与其位置其任务简

2021-07-19 17:09:30 1557

原创 Ubuntu16.04安装torch

1、本地下载自己对应的版本，并上传到linux上下载地址：https://download.pytorch.org/whl/cpu/torch_stable.html我下载的版本是这个2、放到linux的home目录下，并执行以下命令pip3 install torch-0.4.0-cp35-cp35m-linux_x86_64.whl安装成功！...

2021-04-06 11:21:51 322

原创关于pip安装出现的一些问题

1、版本升级You are using pip version 8.1.1, however version 20.0.2 is available. You should consider upgrading via the 'pip install --upgrade pip' command.解决方案：python3 -m pipinstall -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip2.安装完成后，输入pip3

2021-04-06 11:02:38 671 2

原创 Error: A JNI error has occurred, please check your installation and try again Exception in thread “m

报错信息如下：Error: A JNI error has occurred, please check your installation and try againException in thread “main” java.lang.UnsupportedClassVersionError: a has been compiled by a more recent version of the Java Runtime (class file version 59.0), this versio

2021-03-30 15:13:33 543

原创 Linux非root用户安装Mysql

亲试有用！1、下载包，我用的这个版本。链接：https://downloads.mysql.com/archives/community/2、把这个包传到云服务器端。可以再Xftp中直接拖拉上传，我传到了自己的用户目录下，即/home/zhangying/下3、解压：执行命令tar -zxvf mysql-5.6.15-linux-glibc2.5-x86_64.tar.gz4、打开解压后的文件夹cd mysql-5.6.15-linux-glibc2.5-x86_645、执行以下两

2021-03-29 21:42:04 1007 5

原创 Maven - Failed to execute goal org.apache.maven.plugins:maven-surefire-plugin:2.22.1:test

在网上找的好多解决办法都是跳过测试，但是这样不大好，会有隐患，于是自己研究了解决方法。可以打开如图，这个txt里面有具体写错误内容我的错误内容是：java.lang.IllegalStateException: Unable to find a @SpringBootConfiguration, you need to use…解决办法是，将这两个文件放在同一个路径下：然后就可以启动了！...

2021-03-29 15:03:11 382

原创程序包it.sauronsoftware.jave不存在

idea中，准备在maven中package一下，结果出现这个错误，解决方法如下：1、首先你需要下载下面这个包，放在自己的本地2、下载完后，需要把这个包引入到maven的包库中，操作如下：（1）打开本地命令行，切换目录到自己的maven bin目录下：（2）输入以下指令：注意要把java包的路径换成你自己电脑上的路径mvn install:install-file -Dfile=F:\idea\final\jave-1.0.2.jar -DgroupId=it.sauronsoftware -

2021-03-29 14:59:29 9864 3

原创 java.lang.OutOfMemoryError: Failed to allocate a 1920012 byte allocation with 207488 free bytes and

安卓加载动图时，放在真机上闪退。解决方法如下：在manifest.xml中加入下面两行即可。android:largeHeap="true"android:hardwareAccelerated="false"

2021-03-26 11:03:31 777

原创 java.lang.RuntimeException: Can‘t create handler inside thread that has not called Looper.prepare()

在不是oncreate方法里写toast的时候，会出现题目的这个错误。解决方法：用这个包裹一下就可以了~new Thread(){ public void run() { Log.i("log", "run"); Looper.prepare();

2021-03-24 11:14:32 267

原创安卓报错：Only the original thread that created a view hierarchy can touch its views.

我想在运行过程中根据返回的数据，修改图片。结果报出这个错误。经过搜索，发现此原因是因为我没有在oncreate方法中修改组件。解决办法：在修改组件的时候，用一下方法包裹一下就可以了。//temper是这个class的名字temper.this.runOnUiThread(new Runnable() { public void run() { //我要修改的组件内容

2021-03-24 11:04:28 595

原创解决方法：Plugin ‘org.springframework.boot:spring-boot-maven-plugin:‘ not found

按照网上的办法指定了版本还是不行后来点file-invalidate cashes就行了

2021-03-18 09:21:10 452

原创 Android Studio隐藏标题栏方法

找到styles.xml，修改内容：这一行修改为如图内容Theme.AppCompat.Light.NoActionBar

2021-03-13 11:35:10 349

原创 Linux上文本有换行，传到windows下无换行解决方法

1.vim 打开linux下的txt文件2.输入 :set ff=dos3输入 :x就可以了~

2021-03-12 11:40:28 636

原创取tensor中变量值

原本：提取：前面加个float()括起来就可以了。

2021-03-12 10:38:04 625 2

原创 _tkinter.TclError: no display name and no $DISPLAY environment variable解决方法

试了各种配置都不行这个方法肯定可以！import matplotlibmatplotlib.use('Agg')import matplotlib.pyplot as plt

2021-03-06 16:51:43 887

原创力扣LeetCode算法打卡学习第8天

三、字符串中的第一个唯一字符给定一个字符串，找到它的第一个不重复的字符，并返回它的索引。如果不存在，则返回 -1。1、我的——用哈希表统计class Solution { public int firstUniqChar(String s) { Map<String, Integer> hashtable = new HashMap<String, Integer>(); //用哈希表统计字符串出现次数 for (int

2021-03-01 16:16:03 289

原创力扣LeetCode算法打卡学习第7天

二、整数反转给你一个 32 位的有符号整数 x ，返回 x 中每位上的数字反转后的结果。如果反转后整数超过 32 位的有符号整数的范围 [−231, 231 − 1] ，就返回 0。假设环境不允许存储 64 位整数（有符号或无符号）。1、我的class Solution { public int reverse(int x) { boolean check=false; if(x<0){ x=-x; c

2021-02-25 14:59:05 277

原创力扣LeetCode算法打卡学习第6天

开始与字符串相关的题一、反转字符串编写一个函数，其作用是将输入的字符串反转过来。输入字符串以字符数组 char[] 的形式给出。不要给另外的数组分配额外的空间，你必须原地修改输入数组、使用 O(1) 的额外空间解决这一问题。你可以假设数组中的所有字符都是 ASCII 码表中的可打印字符。方法一：我的class Solution { public void reverseString(char[] s) { int length=s.length; for

2021-02-18 10:59:09 273 1

原创力扣LeetCode算法打卡学习第5天

七、加一给定一个由整数组成的非空数组所表示的非负整数，在该数的基础上加一。最高位数字存放在数组的首位，数组中每个元素只存储单个数字。你可以假设除了整数0之外，这个整数不会以零开头。方法：我的算法，由于我没有看到官方答案，这里便只给我的代码分享。class Solution { public int[] plusOne(int[] digits) { int length=digits.length; //最后一位加一 digits[len

2021-02-06 17:31:07 360

原创力扣LeetCode算法打卡学习第4天

五、只出现一次的数字给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。说明：你的算法应该具有线性时间复杂度。你可以不使用额外空间来实现吗？方法1：我的,但是使用了排序的话，复杂度应该就不符合线性的要求了class Solution { public int singleNumber(int[] nums) { if(nums.length<2){ return nums[0];

2021-01-28 10:50:37 336 4

原创神经网络快速入门学习笔记

一、一个简单的神经元如图就是一个简单的神经元。2个输入：X1,X2；1个输出：Y。w1,w2是weight权重，b是bias偏差；偏差的重要性是：主要功能是为每个节点提供可训练的常数值（除了该节点接受的常规输入外）经过这个神经元，处理为w1X1+w2X2+b；再经过一个激活函数f，则形成输出。激活函数f通常是非线性函数，目的是将非线性引入神经元的输出中。因为大多现实世界的数据是非线性的，所以希望神经元去学习这样非线性的形式。激活函数主要介绍3个：1、sigmoid：将输入的值压缩成0~

2021-01-24 17:31:57 439

原创力扣LeetCode算法打卡学习第3天

4.存在重复元素给定一个整数数组，判断是否存在重复元素。如果存在一值在数组中出现至少两次，函数返回 true 。如果数组中每个元素都不相同，则返回 false 。方法1：我的，但是超出时间限制class Solution { public boolean containsDuplicate(int[] nums) { int length = nums.length; for(int i=0;i<length;i++){ for(

2021-01-19 15:58:33 273

原创力扣LeetCode算法打卡学习第2天

3.旋转数组给定一个数组，将数组中的元素向右移动 k 个位置，其中 k 是非负数。方法一：自己的笨办法class Solution { public void rotate(int[] nums, int k) { if(k>=0){ int length = nums.length; k = k%length; int num=0; int[] nums1 = new in

2021-01-19 10:19:12 274

原创 Convolutional Neural Networks for Small-footprint Keyword Spotting论文笔记

CNN被证明优于DNN，因为参数少得多。在这里考虑两种限制，一种是限制乘法次数，另一种是限制参数数量。使用CNN框架时，发现相较DNN，在这些限制的情况下，false reject rate改进了百分之二十七至百分之四十四。由于运行在移动设备上，因此必须具有较小的内存占用和较低的计算能力。目前谷歌的KWS系统使用DNN，优于HMM。而且DNN在设备上运行，可以通过改变网络中的参数数量，很容易地调整模型大小。CNN在过去几年里已经成为声学模型的热门，在各种语音相关的任务（索引中的任务4 5 6 ）里比DNN

2021-01-16 11:02:14 620

原创力扣LeetCode算法打卡学习第1天

第1题给定一个排序数组，你需要在原地删除重复出现的元素，使得每个元素只出现一次，返回移除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。解题：用双指针法因为会改动数组的内容，因此传回删除之后的数组长度时，取此长度的数组内容即可。public int removeDuplicates(int[] nums) { if (nums.length == 0) return 0; int i = 0; for (i

2021-01-13 17:42:14 319

原创 mysql安装教程Windows64位

一、进入官网，点击如下链接https://dev.mysql.com/downloads/mysql/二、选择windows版本，以及64位三、下载后解压四、我解压在了如图的路径中五、在此路径下，创建文件my.ini，并填写以下内容[client]# 设置mysql客户端默认字符集default-character-set=utf8 [mysqld]# 设置3306端口port = 3306# 设置mysql的安装目录basedir=D:\\NewProgram\\mysq

2021-01-09 16:39:55 597

空空如也

空空如也