视觉弘毅-CSDN博客

原创 Qt中QGraphicsView窗口大小与视图大小的关系

在Qt框架中，窗口和视图的大小之间存在一定的关系。

2024-09-11 14:38:56 398

原创 opencv中的几个重要函数

对于我们经常使用python的同学，尤其还习惯使用numpy库，突然上手opencv c++时，就会感觉想要一个结果，python一行代码搞定，但是c++却无处下手，因此特总结遇到的几个重要opencv函数，方便能够快速获取跟python opencv一样的效果。

2024-01-23 18:03:47 749

原创 c++ 计时器chrono使用

【代码】c++ 计时器chrono使用。

2024-01-15 18:02:08 446

安装OpenCV前最好将anaconda3目录屏蔽，去掉环境变量或者直接修改anaconda3为其它名，编译完成后再改回来即可，主要避免opencv会链接很多anaconda3里面的动态库，导致实际使用中的不方便。- BUILD_opencv_python_bindings_generator取消对勾，不使用python。- BUILD_opencv_python_tests取消对勾，不使用python。（1）在cmake的bin目录，打开cmake-gui.exe，配置opencv。

2023-11-11 17:31:44 1250

原创 cmake变量：PRIVATE PUBLIC INTERFACE

cmake中变量PRIVATE、PUBLIC、INTERFACE的理解

2023-10-16 22:46:09 161

原创 caffe 安装

ubuntu16成功安装caffe

2022-12-06 15:59:59 717

原创损失函数focal loss深度理解与简单实现

本文主要从二值交叉熵损失函数出发，通过代码实现的方式，去更好地理解Focal Loss对于数据不平衡问题、难易样本问题损失是如何权衡的。

2022-06-30 11:55:36 1840 1

原创 RPN定位模块细节回顾

RPN是二阶段目标检测中的重要组成部分，如何深刻理解RON对于整体理解二阶段检测算法Faster RCNN具有重要意义。

2022-05-09 14:17:54 748

原创 torch中repeat()函数的准确理解

pytorch中，repeat()这个函数的功能是很容易理解的，但是函数在不同参数下的执行逻辑通常还是会让初次接触的同学有点疑惑，今天仔细想了一下，感觉可以以这样的方式去理解：

2022-03-05 16:55:44 12814 3

原创 Rect Traing for saving memory

code for Rect Traing like YOLOv5.

2022-01-08 11:46:44 1366

原创目标检测：tp与fp理解

介绍在目标检测中，通常采用mAP指标来表达检测模型的性能表现，而mAP指标的计算具体包含几个步骤，其中重要的一步就是TP（真正，即命中）与TP（假正）的计算，具体根据mmdetection中的评估代码mean_ap.py进行分析。def tpfp_func(det_bboxes,gt_bboxes,iou_thr=0.5): """Check if detected bboxes are true positive or false positive. Args:

2020-12-29 14:51:11 4917 2

原创通俗理解torch.distributed.barrier()工作原理

在pytorch的多卡训练中，有一种基于分布式形式的训练模式，在此模式下，不同节点进程之间的数据同步是通过torch的一个函数torch.distributed.barrier()实现。

2020-11-19 19:18:02 30641 17

原创基于pytorch的深度模型参数分别优化与冻结

问题：在深度学习的模型的训练的过程中，经常会遇到需要对不同的模型参数设置不同的学习策略，比如使用不同的学习率，设置权重衰减等，在pytorch框架中的设置相对来说是比较简单的。pytorch中的设置：#coding:utf-8import torchfrom torchvision import models#模型初始化model = models.resnet50(pretrained=True)#根据需要，进行参数分组（权重衰减设置）pg0, pg1, pg2 = [],

2020-11-19 15:24:31 726

原创使用pytorch查看设备显卡详细信息

1、设置可用显卡import osos.environ["CUDA_VISIBLE_DEVICES"] = '0,1,2,3'2、查看当前设备环境可用显卡数量ng = torch.cuda.device_count()print("Devices:%d" %ng)3、查看可用显卡的具体信息（型号、算力，显存以及线程数）import torchinfos = [torch.cuda.get_device_properties(i) for i in range(ng)].

2020-11-19 11:33:25 11431

原创 Error response from daemon: Cannot restart container mdet_jc: OCI runtime create failed（fork/exec /）

1、问题描述Error response from daemon: Cannot restart container mdet_jc: OCI runtime create failed: unable to retrieve OCI runtime error (open /run/containerd/io.containerd.runtioby/96150a100ace76f63e68ef9af199e29ccaee249d65af39422a2302a59359d6f6/log.json: n

2020-07-23 17:18:22 2442

原创更改Ubuntu默认启动内核以及禁止内核更新

1、查看现用内核uname -r2、查看所有内核名称grep menuentry /boot/grub/grub.cfg3、查看所有内核sudo update-grub4、设置默认启动内核(1)sudo gedit /etc/default/grub(2) 将文件中的GRUB_DEFAULT=0改为GRUB_DEFAULT=”1> 6”(3) 将(2)中的6替换为自己需要的（所大于需版本的版本数目*3，或者2命令显示中的所需版本序号，从0开始）(4) s.

2020-07-11 18:01:46 358

原创 Anaconda 使用清华镜像安装最新版本pytorch（1.3）

1、添加镜像源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anacond

2020-07-09 20:56:56 1242

原创 Slam初探:基础背景了解

本文为学习<<视觉Slam十四讲>>的简述性笔记,更多内容请查阅书籍进行深入了解.初识Slam:Slam功能技术主要用于机器人,无人机,自动驾驶汽车以及一些增强现实,三维重建与环境恢复等应用方向,本文介绍其在小萝卜机器人上的应用.小萝卜为了完成在房间内的自由活动,需要完成两件事(这两件事情也是Slam的本质所在):1. 自我定位,知道自己目前的位置;2....

2020-04-06 13:40:45 1817

原创 caffe中DataTransformer类方法Transform中data_index的计算原理

问题抛出：int top_index, data_index; for (int c = 0; c < datum_channels; ++c) { for (int h = 0; h < height; ++h) { for (int w = 0; w < width; ++w) { //data_index是如何计算的? ...

2020-04-01 19:10:52 314 1

原创细粒度目标生成与探索：FineGAN之解耦表示

论文发表：CVPR2019本文是一篇关于无监督的细粒度物体类别识别的论文。概述本文提出了一个无监督的GAN框架FineGAN，其可以分离背景，物体形状以及物体外观，并级联地生成细粒度物体类别的图像。为了无监督地分离几个因素，关键思想就是利用信息理论关联每一因素到潜在的编码，并以一种特定的方式规范编码之间的关系，以推导出所需的层次结构。利用FineGAN自动学习的特征对...

2019-11-22 10:21:45 2478

原创 pkg-config搜索路径与添加

1、搜索#命令pkg-config --variable pc_path pkg-config#结果/usr/local/lib/x86_64-linux-gnu/pkgconfig:/usr/local/lib/pkgconfig:/usr/local/share/pkgconfig:/usr/lib/x86_64-linux-gnu/pkgconfig2、添加exp...

2019-10-27 15:57:19 5475

原创 RuntimeError: The Session graph is empty. Add operations to the graph before calling run()

问题来源：在Flask接口设计中应用了基于tensorflow的keras框架，由于keras本身的会全部占用gpu显存，因此引入了如下限制机制：import tensorflow as tffrom keras.backend.tensorflow_backend import set_sessionconfig = tf.ConfigProto() config.gpu_op...

2019-08-26 20:33:58 25446 3

转载基于python3.6的libboost库安装（用于anaconda3安装caffe）

下载安装：wget -O boost_1_55_0.tar.gz http://sourceforge.net/projects/boost/files/boost/1.55.0/boost_1_55_0.tar.gz/download tar xzvf boost_1_55_0.tar.gz cd boost_1_55_0/sh ./bootstrap.sh --w...

2019-06-14 17:30:38 4285

转载对Caffe中batch_size和iter_sized理解

本文基本来自参考首先，iter_size是caffe的solver.prototxt中的一个重要参数，很多人在使用caffe训练模型的时候，只知道网络中定义了batch_size, 而不怎么了解知iter_size以及其与batch_size的联系。一、 iter_size是什么？solver.prototxt中的iter_size的确是一个计算batch_size的重要参数，ca...

2019-05-19 22:19:23 635

原创基于k-倒排最近邻的检索重排序

论文：Re-ranking Person Re-identification with K-reciprocal Encoding即行人重识别中经常用来提升检索MAP与CMC指标的经典re-ranking方法。论文中算法公式较多，需要有耐心理清其算法步骤。下图为重排序架构图。Abstract行人重识别作为图像检索的子问题，重排序能够在后期很大程度上提高检索准确率。本...

2019-04-16 15:11:22 3016

转载 pytorch版本回退解决No Module named 'torch.legacy'

版本回退主要是为了解决新版本的pytorch往往会舍弃一些过去会用到的类与接口，比如torch.legacy等在torch1.0.1版本中是被舍弃了，无法正常使用的，而在0.4.1中是仍然保存的。一、Conda降级pytorch版本或安装指定版本pytorch如果你是使用conda包管理，你可以很容易实现版本降级，你只需要指定版本即可：# 比如你想降级到以前的v0.4.1版本c...

2019-04-03 13:12:18 12211 3

原创近年来Person Re-identification论文汇总

CVPR 2018: 1、Person Transfer GAN to Bridge Domain Gap for Person Re-Identification 北京大学团队2、Diversity Regularized Spatiotemporal Attention for Video-Based Person Re-Identification3、A Pose-Sensit...

2019-04-01 21:18:35 2764

原创基于深度学习的端到端的车牌检测与识别

论文题目：Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks摘要：对于自然场景下的车牌检测与识别任务，本文提出了一个统一的可以同时定位车牌与识别字符的端到端的网络框架。相比于分步进行车牌检测与识别的现有方法，单个网络的联合解决方案可以避免中间过程的错误累计，，...

2019-03-08 20:31:51 9118 1

原创基于联合贝叶斯准则的深度特征融合车辆再识别

论文题目：Vehicle Re-Identification by Deep Feature Fusion Based on Joint Bayesian Criterion（ICPR）Abstract：车辆重识别不同于行人重识别，其挑战性在于同种款式的不同车辆之间差异十分细小。本篇论文提出了双网络深度融合特征，两个网络可以提取输入图像的不同层面的特征并可以互相补充。通过提出的联合贝叶斯损...

2019-03-06 14:09:38 1382

原创 RNN之多层LSTM理解：输入，输出，时间步，隐藏节点数，层数

从pytorch代码角度初次理解LSTM各种术语。LSTM:class torch.nn.LSTM(*args, **kwargs)Parametersinput_size 输入特征维数：（特征向量的长度，如2048）hidden_size 隐层状态的维数：（每个LSTM单元或者时间步的输出的ht的维度，单元内部有权重与偏差计算）num_layers RNN层的个数：（在竖直...

2019-02-28 16:37:39 62916 5

原创关于最近用于细粒度车辆分类的深度学习框架的系统评估

本文是一篇关于细粒度分类的深度框架评估的论文，主要利用最有前景的CNN进行了各种实验，探究了直接微调具有SOTA性能的CNN在图像分类任务上的潜能。可以作为车辆再识别与车辆细粒度分类的一个知识补充。论文题目：A Systematic Evaluation of Recent Deep Learning Architectures for Fine-Grained Vehicle Classif...

2019-02-20 17:30:41 1831 4

原创 pytorch训练之数据加载步骤

本文章以ReID的数据加载为例。from torch.utils.data import dataset, dataloaderfrom torchvision import transforms一、建立自定义数据处理方法类：如随机擦除，随机裁剪等代码：class RandomErasing(object): def __init__(self,probability=0.5...

2019-02-15 17:08:21 2519

原创行人重识别之Horizontal Pyramid Matching

论文名称：Horizontal Pyramid Matching for Person Re-identification摘要：目前现有方法仍存在具判别性的人体部件丢失问题，为了缓解这一问题，本文提出了HPM模型，可以充分利用行人的不同局部空间信息，使得即使存在重要部件丢失仍能识别正确的候选行人图像。Introduction：为了缓解利用全局特征会丢失重要的局部判别性信息的问题，最...

2019-01-22 19:00:13 3226 3

原创行为识别之双流卷积网络

1、简介从视频中进行行为识别，其挑战在于从静止帧捕获关于外观和帧间运动的补充信息。贡献有三：a. 结合了时空信息 b. 多帧密集光流有助于性能提高 c. 多任务学习可用于增加训练数据量该网络在 UCF-101 and HMDB-51两数据集上具有较好性能表现。相比静态图像分类，视频的时序成分为行为识别提供了额外的线索（运动信息），并且视频本身对每帧图像具有天然的数据增强功能（帧...

2018-11-30 19:04:30 25953 2

原创 SSD目标检测论文简读

本文简单综合性地介绍一下SSD,SSD文章内容信息较多,若有失误之处,望能热心指出,感谢.SSD框架介绍: 算法的主网络结构是VGG16，将两个全连接层改成卷积层(Conv6与Conv7)再增加4个卷积层构成网络结构。然后对6个特征图使用3*3卷积滤波器(k*(c+4)个滤波器)进行卷积,生成对应特征图大小的深度为k*(c+4)的矩阵,然后将6不同特征图得到的矩阵分别在分辨率维度上...

2018-09-11 18:37:13 753

原创 ICNet模型介绍

2018-08-29 15:50:27 5215

原创 DenseAspp论文解读

DenseAspp论文解析

2018-08-29 15:39:15 6140 3

weixin_41041772的博客