计算机视觉
文章平均质量分 84
五四三两幺-发射!
这个作者很懒,什么都没留下…
展开
-
YOLOX笔记
正负样本划分过程说明: gt_centerbbox是在gt_bbox中心点向四周发散的bbox, 中心点到该bbox四边的距离是 center_radius * expanded_strides_per_image1. is_in_boxes: [n_gt, n_anchor], 样本中心点是否落在各个gt_bbox里面2. is_in_boxes_all: [n_anchor], 样本中心点是否至少落在1个gt_bbox里面3. is_in_centers: [n_gt, n.原创 2021-07-23 15:29:28 · 3575 阅读 · 11 评论 -
目标检测DETR理解: 从网络前向张量的变化开始
文章官方git仓库原创 2021-06-17 14:38:54 · 1231 阅读 · 2 评论 -
SiamFC、RPN系列中样本对pair(模板图和搜索图)生成方式
准备数据集时,需要exemplar图和search图(或称为instance图),对应大小为exemplar_size(比如127)和search_size(比如255)这种处理有两种形式第一种,处理原始数据集阶段:(参考https://github.com/STVIR/pysot/blob/master/training_dataset/vid/par_crop.py) 对于原...原创 2020-01-17 15:44:28 · 1231 阅读 · 5 评论 -
高斯模糊(高斯滤波)的原理与算法
该文章为转载内容,转自https://blog.csdn.net/nima1994/article/details/79776802,http://www.ruanyifeng.com/blog/2012/11/gaussian_blur.html通常,图像处理软件会提供”模糊”(blur)滤镜,使图片产生模糊的效果。“模糊”的算法有很多种,其中有一种叫做“高斯模糊”(Gaussi...转载 2020-01-01 15:02:54 · 2050 阅读 · 0 评论 -
把vgg-face.mat权重迁移到pytorch模型
最近使用pytorch时,需要用到一个预训练好的人脸识别模型提取人脸ID特征,想到很多人都在用用vgg-face,但是vgg-face没有pytorch的模型,于是写个vgg-face.mat转到pytorch模型的代码#!/usr/bin/env python2# -*- coding: utf-8 -*-"""Created on Thu May 10 10:41:40 2018...原创 2018-05-17 11:00:39 · 3245 阅读 · 7 评论 -
InforGAN笔记
InforGAN笔记Purpose: 通过非监督学习得到可分解的特征表示.Motivation:由于G使用噪声z的时候没有加任何的限制, 所以1z是在以一种高度混合的方式被使用, 2z的任何一个维度都没有被明显的表示数据的一个特征(即我们不知道什么样的噪声可以生成数字1,什么样的噪声可以生成数字3...)Solution:作者在生成器的输入中, 除了z之外还增加了一个隐含编码c(也是随机的)...原创 2018-06-07 21:06:08 · 1314 阅读 · 0 评论 -
starGAN的笔记(代码)
一、图片和标签融合输入CNN:把标签转为one_hot(记为c), 维度是类别的个数, 假设是5个类别, 那么x.size()==>[nb, cn, h, w] (cn是图片通道)y.size()==>[nb, 1]c.size()==>[nb, 5]在generator的forward时, 把c扩展到四个维度(记为c_expand), 第3 4维度值和x一样首先通过...原创 2018-01-25 21:12:32 · 2958 阅读 · 7 评论