optimistic丶中-CSDN博客

原创解决VSCode只能开两个标签页的问题

解除VSCode只能打开两个标签页的限制

2022-06-09 17:34:39 1656

原创关于在云服务器上（这里用腾讯云）安装mysql8.0并使本地可以远程连接的方法

远程连接服务器数据库的记录

2022-06-08 17:47:30 569

原创关于SIoU《SIoU Loss: More Powerful Learning for Bounding Box Regression Zhora Gevorgyan 》的一些看法及代码实现

最近很多公众号都在推这篇文章，但是我在阅读的过程中产生了一些问题，由于代码未开源，理解可能不正确，因此先记录一下，等开源之后对照代码再更深地去理解，也希望如果有大佬看见这篇文章的时候，能对我不成熟的看法给予一些意见。文章实验的最终损失函数计算如下：其中LclsL_{cls}Lcls是用了focal loss，WboxW_{box}Wbox和WclsW_{cls}Wcls权重参数是根据遗传算法计算得来的，LboxL_{box}Lbox是本文所提的SIoU损失，计算如下：主要是涉及到四部分损失

2022-05-30 17:49:52 3670 4

原创 python划分数据集并使各类别的数目相近

最近项目拿到了一个别人标注但没有划分的数据集，有13类，不过经过统计发现各类别的数目差距较大，最多的一类有五万多张图片，最少的一类只有两千多张，如果使用传统的划分方法，对所有的数据进行随机划分，将会导致样本严重不均衡的问题，甚至可能出现训练集中不存在某一类图片，因此考虑以最少的一类图片数目为基准，对每一类都选择两千张左右的图片，并且使用蓄水池算法保证选取的随机性，考虑到同一张图片中可能存在多个目标，并且目标也不一定是同类，因此对每一张图片的标注文件只参考其第一个标注的目标类别（如果标注文件中有没有标注的目标

2022-05-27 16:02:24 526

原创编译spring源码过程

首先进入spring的官网spring.io从Projects的Spring Framework点进去进入spring framework的github地址下载spring的源码，并找到相关的操作文档之后找到与IDE导入相关的文档在spring源码的项目文件中，找到build.gradle文件，在里面buildscript 和configure(allprojects) 部分中添加阿里的镜像源配置完后在项目文件目录输入 ./gradlew :spring-oxm:compileTest

2022-05-18 16:47:51 137

原创 VSCode中关于go依赖的安装

最近参加了字节青训营，开始系统地学习GO语言，对于IDE，在VSCode和GoLand之间选择了前者，但没想到前两天安装完GO插件的时候，每次打开VSCode都会出现以下提示：这一步我熟，无非就是墙的事情，然后我开了VPN后才发现事情没有这么简单，并没有办法在开了VPN后就顺利安装，不过貌似好像也不影响我编写和运行代码，于是为了不错过青训营的有限课程时间，之前一直没有管这个问题，想着也许哪天网络就通了呢，但是今天还是出现这个错误，那就只能硬刚了。首先照着问题去网上查的时候，发现都在说gopath的问题

2022-05-10 16:56:55 1261

原创关于jwt的一些补充学习

去年的时候做过一个仿商城项目，在开发用户登陆以及后续需要用到用户数据的功能的时候，发现每次启动服务器，session都会清空，因此想到用浏览器本地的cookie数据存储，查阅资料的时候发现了JWT，当时就是把其当做一个签名算法，只是为了提高数据的安全性，因此当时的学习主要是学会它怎么在项目中使用，因此当时很多学习是跟着网上的博客进行，比如在搜索其实现demo的时候，直接复制它们的maven依赖，并且照着其demo照猫画虎，改一下签名密钥和算法、body的数据以及token的生成和有效时间，当时还记得因为学到

2022-04-20 10:41:45 518

原创关于linux压缩会带路径的问题

今天在linux下用tar压缩文件的时候，发现压缩过去会带着文件原来的绝对路径，因此在linux上重新写了一份相关demo，首先创建tar_demo文件夹mkdir tar_demo再创建两个txt文件touch 1.txttouch 2.txt压缩这两个文件到test.tar中tar -cvf /home/ubuntu/test.tar /home/ubuntu/tar_demo/*.txt再创建准备解压放的文件夹untar_demo，并将test.tar解压至该文件夹（这里的C一定要

2022-04-18 17:42:24 2511 1

原创 EfficientNet简述

引言目前提升卷积神经网络的准确性方法大多是扩大其规模，比如从网络深度、网络宽度或者图像分辨率中选择，通常是缩放中一个方面进行提高，比如ResNet-18到ResNet-200就是使用了更多层，尽管可以任意缩放两个或三个维度，但是任意缩放都需要繁琐的手动调整，并且仍然能产生次优的精度和效率。因此本文研究并重新思考扩展网络的过程，研究表明，平衡网络宽度、深度和分辨率的所有维度是至关重要的，这种平衡可以通过简单的固定比例缩放来实现。在此基础上，本文提出了一种简单而有效的复合模型扩张方法（compoun

2022-04-15 15:06:16 782

原创 “this is incompatible with sql_mode=only_full_group_by”报错记录

今天刷牛客网《获得积分最多的人(二)》题目的时候，从题解中学到可以用临时表来解决冗余代码的问题，代码如下with temp as ( select u.id, u.name, sum(g.grade_num) as grade_num from user u join grade_info g on u.id = g.user_id group by u.id)select id, name, grade_numfrom tempwhere grade_

2022-04-12 17:34:28 763

原创关于重写hashCode和equals方法的一些思考

经常能看到重写equals方法就需要重写hashCode方法的说法，这点也很好理解，假如重写equals使得两个对象通过equals判断为真，但是如果hashCode计算出来的值如果不一样，就会发生矛盾，就是明明两个对象是一样的，但是却会被映射到不同位置，这样子的话，hashMap或者hashSet之类的哈希结构就会存储多个相同的对象。还可以通过一个例子理解 Map<String,Value> map1 = new HashMap<String,Value>();

2022-04-09 14:33:47 1761

原创由“用3个线程循环打印1到10的数”引发的思考

上周看到一道面试题：用3个线程循环打印1到10，即第一个线程打印1，第二个打印2，第三个打印3，再第一个打印4，依次循环，正好复习线程池，便首先用线程池创建三个线程，每一个线程创建一个变量，利用余数来判断每个数该有哪有线程打印```csharp```bash```cpp`在这里插入代码片`package thread;import java.util.concurrent.ArrayBlockingQueue;import java.util.concurrent.ThreadPool

2022-04-01 17:33:07 672

原创 Windows安装RabbitMQ遇到的问题记录

安装RabbitMq的时候，一开始是按照Erlang官网最新的24.2.1和RabbitMq官网最新的3.9.13版本下载，在安装RabbitMq_Management的时候就遇到了这样的问题在网上找了很多资料无果后思考是否是版本不兼容的问题，于是我按照一个成功的博客中的版本进行安装Erlang-23.0和RabbitMq-3.8.8，在检查安装的时候发现依旧失败看有人说可以把User下的.erlang.cookie，复制并替换掉Windows中的.erlang.cookie，经过尝试后失败也看有

2022-02-23 20:48:45 707

原创关于redis启动的问题记录

因为最近想重新复习一下redis的操作，今天用Redis DeskTop Manager打开redis的时候，看到了很久以前项目留下来的数据，想清理一下，于是删除完去吃晚饭回来，redis虽然server端还是开着的，但是这个时候进行新增操作的时候，发现一直在等待，然后想着可能是空闲时间太长自动关了，又重新打开后，发现之前删掉的文件又重新回到了redis，于是我想到了持久化问题，打开redis.windows.conf设置了save的时间，又打开了AOF，再删除了之前的项目文件，并且新建了一个demo文件，

2022-02-21 23:53:03 333

原创数据库中文乱码问题

最近遇见了一个很奇怪的问题从数据库中读取中文字符的时候，会出现乱码问题首先一步一步检查字符编码问题一开始数据库是用Navicat创建的可以看出数据库中的格式是UTF-8JDBC的连接字符集格式也是UTF-8文件编码也是UTF-8打印表中一行数据测试，原数据与打印结果如下发现在Navicat中是正常显示，但是最后获取到的中文是呈现乱码形式为了进一步定位问题，使用CMD查看数据库内容发现在CMD中查看，确实是以乱码形式存储使用show variables like "chara

2022-01-05 18:20:11 3631

原创 TPH-YOLOv5简述

引言无人机捕获场景下的目标检测技术已广泛应用于植物保护、野生动物保护和城市监测等实际应用中，在无人机捕获的图像上的目标检测性能，并为上述众多的应用提供洞察力。本文专注于在无人机上的目标检测性能提升，并服务于上述应用。近年来，基于深度卷积神经网络的目标检测任务取得了显著进展，一些著名的基准数据集，如MS COCO和PASCAL VOC，推动了目标检测应用的发展，然而，以往的深度卷积神经网络大多是针对自然场景图像设计的。直接应用之前的模型来处理无人机捕获场景下的目标检测任务主要有三个问题，如图1所示

2021-11-05 16:52:16 9527 5

原创 SimROD简述

引言当训练的图像与测试集具有相同的分布时，SOTA的目标检测模型已被证明是高度准确的。然而，当部署到新的环境时，它们可能会失败，因为域的变化，如天气变化(如雨或雾)，光线条件的变化，或运动模糊，在目标检测中，已经提出了许多克服域偏移的方法，可分为数据增强（《Benchmarking robustness in object detection: Autonomous driving when winter is coming，2019》、《Augmix: A simple data processin

2021-11-05 16:44:35 471

原创 DETR简述

引言目标检测任务是预测感兴趣目标的bbox和类别标签集合，现代检测器不是直接预测一个目标的集合，而是通过使用回归和分类去处理大量的proposals、anchors或者window centers来替代，模型的效果会受到一系列问题的影响：比如用于处理近重复预测的后处理步骤、anchor集合的设计以及anchor与ground truth的分配策略等。为了简化检测流程，本文跳过代理任务（surrogate tasks，应该就是指回归分类之类的替代任务）直接预测输出集合，这种端到端理念在一些复杂的结构化预

2021-11-05 16:36:55 3311

原创 CBNetV2简述

引言深度卷积网络的蓬勃发展使目标检测取得了很大的进展，一般来说，在基于神经网络的检测器中，骨干网络用于提取检测目标的基本特征，通常最初设计用于图像分类，并在ImageNet数据集上进行预训练，从直观上看，骨干网络提取的代表性特征越多，其检测器的性能越好，简单地说，一个更强大的骨干带来更好的检测性能。从AlexNet开始，主流探测器已经利用了更深更宽的主干，如VGG， ResNet， DenseNet， ResNeXt（《Aggregated residual transformations for d

2021-11-05 16:32:17 1229

原创 ResNet简述

引言深度网络以端到端多层的方式自然地集成了低/中/高级特征以及分类器，特征可以由网络的深度来丰富，因此ImageNet竞赛的参赛模型都趋向于“非常深”——16 层到30层。许多其它的视觉识别任务的都得益于非常深的模型。在深度的重要性的驱使下，出现了一个新的问题，梯度消失/梯度爆炸从一开始便阻碍了模型的收敛。初始归一化（normalized initialization）和中间归一化（intermediate normalization）在很大程度上解决了这一问题，它使得数十层的网络在反向传播的随机

2021-11-05 16:23:14 525

原创 DLA简述

引言更深层的神经网络可以提取更多的语义信息和全局特征，但这不代表最后一层是任务的最终表示，跳跃连接就已经证明了这一点，跳跃连接对分类和回归以及结构化任务是有效的，本文研究如何聚合层以更好地融合语义和空间信息进行识别和定位，扩展当前方法的“浅”跳跃连接，聚合架构更多深度和共享，介绍两种深度聚合(DLA)结构：迭代深度聚合(IDA)和分层深度聚合(HDA)。IDA主要进行分辨率和尺度的融合，而HDA主要融合各种模组和通道的特征。IDA根据基础网络结构，逐级提炼分辨率和聚合尺度(类似ResNet)。H

2021-11-05 16:15:09 5649

原创 DCNv2简述

引言由尺寸，位置，视野，部分变形成为目标识别检测中的一个挑战。DCNv1 介绍了两个模型，（1）可变形卷积：标准卷积网格采样点的位置都是前面预处理feature map学习的偏移。（2）可变形RoIpooling，其中，偏移学习RoIPooling中的bins的位置。将上述两个模型嵌入到神经网络中可以按照目标物的特性进行特征表示，通过变形采样及池化模式来适应目标物体的结构。基于上述方法，大幅度提高了目标检测的效果。为了理解可变形卷积，通过在VOC图像上采样点的位置上增加偏移，并可视化其引

2021-11-05 16:09:07 7883

原创 Focal Loss简述

引言本文进一步提高了one-stage检测器的性能，设计出了一个one-stage目标检测器，并首次达到了更复杂的two-stage检测器所能实现的最高COCO平均精度，例如FPN(特征金字塔网络，Feature Pyramid Network) 或 Mask R-CNN(Faster R-CNN的变体)，本文发现训练过程中的类别不平衡是阻碍one-stage检测器实现这个结果的主要障碍，并提出了一种新的损失函数来消除这个障碍。 R-CNN 检测器通过两阶段的级联(cascade)和启发式采样(s

2021-11-05 16:01:16 565

原创《》One More Check: Making “Fake Background” Be Tracked Again》简述

引言图1展示了one-shot模式跟踪的典型失败样例，蓝色箭头表示帧连续的方向，图中红色框表示由于较小的前景概率而被当作背景的目标，从整个帧序列上看，由于这几个漏检目标，导致了轨迹段的时间一致性被破坏。作者经过思考发现这种虚假背景的根本原因其实是过于依赖基于图像的检测结果了。换句话说，检测器从背景中区分目标仅仅基于单帧的视觉线索。然而，实际跟踪的场景都是极具挑战的，比如遮挡、小目标、背景杂乱等，这些都会造成视觉特征的有效性下降，最终可能误导检测器将目标分类为背景。因此，仅仅依靠检测器得到目标的位置在跟

2021-11-04 20:08:32 373

原创 CenterNet简述

引言如图2所示，本文通过目标中心点来表示物体，然后在在中心点位置回归出目标如维度、大小、姿势等其他属性，把目标检测问题转变成一个标准的关键点估计问题，将图像传入全卷积网络，得到一个热力图，热力图峰值点即中心点，每个特征图的峰值点位置预测了目标的宽高信息。模型训练采用标准的监督学习，推理仅仅是单个前向传播网络，不存在NMS这类后处理。运行速度与AP如图1所示：相关工作 Object detection by region classification：RCNN系列方法枚举大量候选的对象位

2021-11-04 19:52:27 379

原创《Rethinking the competition between detection and ReID in Multi-Object Tracking》简述

引言基于ReID的跟踪器目前分为two-stage和one-shot两种，前者精度不错但由于ReID需要在每个检测框上推理，所以计算量很大，因此one-shot方法越来越受关注，本文分析one-shot方法的过程，表明性能下降主要因为两个方面：（1）检测和ReID任务之间的过度竞争:在one-sho方法中，对象置信度、目标大小和ID信息同时从共享embedding中获得。虽然效率很高，但不同任务之间的内在差异却被忽视了，检测任务需要的是同类的不同目标拥有相似的语义信息（类间距离最大），而 ReI

2021-11-04 19:47:34 551

原创《Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers》简述

引言最先进的实例分割方法通常遵循Mask R-CNN范式，第一阶段检测边界框，然后第二阶段分割实例掩码。然而，本文注意到，大多数性能的改进来自于更好的主干架构设计，而在从目标检测中获得感兴趣区域(Region-of-Interest)特征后，很少关注实例掩码回归，本文观察到很多分割错误是由重叠对象引起的，特别是属于同一类的对象实例，这是因为每个实例掩码都是单独回归的。本文提出了双层卷积网络(BCNet)，如图1所示： BCNet在提取ROI后，同时对遮挡区域(occluder)和部分遮挡对

2021-11-04 19:43:25 907

原创 EfficientNetV2简述

引言随着模型和训练数据的规模越来越大，训练效率对深度学习非常重要，这篇文章使用训练感知神经结构搜索(NAS)和缩放相结合，以提高训练速度和参数效率。本文首先系统地研究EfficientNets（原文这里是这样写的，但是我认为是EfficientNet）的训练瓶颈。在EfficientNets上的研究表明： 1.使用非常大的图像尺寸进行训练是缓慢的； 2.深度卷积在早期层段是缓慢的； 3.同等地扩大每个阶段是次优的。很多以前的论文里，通常对所有图像大小保持相同的正则化，导致精度下

2021-11-04 19:39:14 1669

原创 TrackFormer简述

引言传统的TBD方法在数据关联上采用时序稀疏（《Multiple hypothesis tracking revisited》、《Everybody needs somebody: Modeling social and grouping behavior on a linear programming multiple people tracker》）、密集图优化（《Motion segmentation & multiple object tracking by correlation c

2021-11-04 19:32:15 1434 1

原创 TransTrack简述

引言如图1a所示，当前的MOT方法一直遭受模型复杂性和计算成本的困扰。目标检测和重新识别分别进行，它们不能互惠互利，即难以一个backbone实现这两个任务，不会给两个连续帧之间的无序目标对或每个帧中不完整的检测目标带来挑战。回顾单目标追踪中，使用的孪生网络就是一种Query-Key机制，对象目标就是query，图像区域为key（图1b）。相同目标在不同帧中的外貌特征是极度相似的，能够使用Query-Key机制来输出有序目标集。相同的思想运用于MOT，过去帧目标特征作为query，当前帧图像特征作为k

2021-11-04 19:09:28 2453

原创《Tracking without bells and whistles》简述

引言在一个视频序列中跟踪多个目标包含几个有挑战性的任务。就“基于检测的跟踪”这个技术而言，它包括目标再识别、运动预测以及处理遮挡。本文提出一种没有任何额外设计的追踪算法，在不专门针对这些目标设计的前提下，实现目标的追踪，特别是不对追踪数据做任何的训练或者优化。为此，本文利用对象检测器的包围框回归来预测下一帧中对象的位置，从而将检测器转换为跟踪器。目前多目标跟踪领域产生了越来越复杂的模型，但只是获得了略好的效果，本文只对神经网络进行检测任务的训练，也可以在检测任务上达到start-of-the-art的

2021-11-04 19:08:35 432

原创《MOTS: Multi-Object Tracking and Segmentation》简述

引言 Bounding box级跟踪性能已经达到饱和，只有在移动到像素级别时才能进一步改进。因此，本文建议将检测、分割和跟踪视为需要一起考虑的相互关联的问题。用于训练和评估目标分割模型的数据集通常不提供关于视频数据的标注，甚至不提供关于不同图像中对象身份的信息。另一方面，多目标跟踪的常用数据集仅提供对象的边界框注释。这些可能太过于粗糙，例如，当物体被部分遮挡时，它们的边界框包含来自其他物体的更多信息而不是自身，如图1所示：因此本文做出如下贡献： (1) 基于流行的KITTI和MOTChall

2021-11-04 19:00:57 1084 1

原创 CenterTrack简述

引言早期网络强调追踪时空中感兴趣的目标，虽然快速，简单，但是容易忽略低级的线索（角和高强度峰值）。随着高性能检测器的出现，便出现先检测后追踪模式，将检测和追踪分为两步：首先在每帧中找到所有目标，然后追踪的任务就变成了一个边界框关联。因为给定了检测的结果，只需要关注如何将相同的目标连接起来（轨迹）即可。但是大多数的关联策略都是复杂的，高计算量的。本文提出了一种基于点的联合检测和跟踪框架，称为CenterTrack，每个对象都由其边界框中心的单个点表示，然后通过时间跟踪这个中心点，如图1所示：

2021-11-03 11:56:11 2008

原创 FairMOT简述

引言多目标跟踪目的是估计视频中感兴趣的轨迹，目前跟踪都是利用两个模型：检测模型首先通过每帧中的包围盒定位感兴趣的对象，然后关联模型提取每个包围盒的重新识别(re-ID)特征，并根据特征上定义的某些度量将其链接到其中一个已有的轨迹。然而，这些方法不能进行实时推理，特别是当存在大量对象时，因为两个模型不共享特征，并且它们需要对视频中的每个边界框应用Re-ID模型。随着多任务学习的成熟，利用单一网络进行目标估计和重识别的one-shot跟踪器受到了越来越多的关注，《Mots: Multi-object tr

2021-11-03 11:49:20 1754

原创 SSD简述

引言本文提出了SSD，它不对边界框假设的像素或特征进行重采样，并且与其他方法有一样精确度。这对高精度检测在速度上有显著提高（在VOC 2007测试中，59fps和 74.3%的mAP，与Faster R-CNN 7FPS和 73.2%的mAP或者YOLO 45 FPS和63.4%的mAP相比）。速度的根本改进来自消除边界框提出和随后的像素或特征重采样阶段。改进包括使用小型卷积滤波器应用于网络后期的多个特征映射中，以执行多尺度检测，通过这些修改，特别是使用多层进行不同尺度的预测，使得可以使用相对较低的分

2021-11-03 11:39:41 411

原创《Joint detection and online multi-object tracking》简述

引言多目标跟踪方法通常由以下部分组成：检测模块、检测-跟踪相似性度量、track管理。检测模块用于查找包含特定对象类别实例的边界框；相似性度量用于将检测合并到跟踪中；track管理包括决定何时创建新track以及何时终止旧track。此外，它决定如何更新track，例如相关联的检测是否可信。本文提出了一种在线多目标跟踪方法，该方法将所有组件集成在一个神经网络中。使用递归神经网络(RNN)将轨迹与检测相关联，并更新每帧中的轨迹表示。本文提出了一种基于空间距离、物体外观、检测分数和track分数的检

2021-11-03 11:31:58 418

原创 JDE简述

引言多目标跟踪目的是预测视频内多个物体的运动轨迹，这个问题的主要策略是先检测后跟踪，将其分为两个步骤：Step1：检测，对单视频帧目标进行定位；Step1：数据关联，分配检测到的物体并连接到现有轨迹。这意味着系统至少需要两个计算密集型组件： detector 和embedding (re-ID) model。为了方便起见，本文将这些方法称为“分离的检测和嵌入”方法（Separate Detection and Embedding (SDE)。因此，总推理时间大致是两个分量的总和，并且将随着目标数量的增

2021-11-03 11:23:29 3655

空空如也

空空如也