计算机视觉
文章平均质量分 92
Adenialzz
Keep Learning.
展开
-
自监督表征预训练之对比学习
自监督表征预训练之对比学习原创 2023-02-23 23:15:51 · 1129 阅读 · 0 评论 -
自监督表征预训练之掩码图像建模
自监督表征预训练之掩码图像建模原创 2023-02-20 13:03:09 · 3138 阅读 · 0 评论 -
多模态论文串讲笔记
多模态论文串讲笔记原创 2023-02-16 22:19:31 · 2783 阅读 · 0 评论 -
CLIP 改进工作串讲(下)
CLIP 改进工作串讲(下)原创 2022-10-17 15:54:41 · 3417 阅读 · 5 评论 -
CLIP改进工作串讲(上)
CLIP改进工作串讲(上)原创 2022-10-15 21:16:04 · 5405 阅读 · 1 评论 -
动手实现CNN
动手实现CNN原创 2022-09-27 20:39:53 · 2154 阅读 · 0 评论 -
MobileNet 系列:从V1到V3
MobileNet 系列:从V1到V3转载 2022-09-26 13:30:34 · 498 阅读 · 0 评论 -
图像仿射变换OpenCV API与自行代码实现
图像仿射变换OpenCV API与自行代码实现原创 2022-09-18 23:27:34 · 1271 阅读 · 0 评论 -
DETR精读笔记
DETR精读笔记原创 2022-08-27 16:42:42 · 2046 阅读 · 0 评论 -
深度学习时代的视频理解综述
本文为[b站@bryanyzhu](https://space.bilibili.com/511378644)老师四期视频理解相关论文解读的汇总图文笔记。原创 2022-08-08 23:09:06 · 7066 阅读 · 0 评论 -
AI移动端优化之Im2Col+Pack+Sgemm
这篇文章是基于NCNN的Sgemm卷积为大家介绍Im2Col+Pack+Sgemm的原理以及算法实现,希望对算法优化感兴趣或者做深度学习模型部署的读者带来帮助。转载 2022-07-12 22:41:31 · 873 阅读 · 0 评论 -
DCN可形变卷积实现1:Python实现
DCN可形变卷积实现1:Python实现原创 2022-07-11 19:55:20 · 4339 阅读 · 0 评论 -
【详细图解】再次理解im2col
【详细图解】再次理解im2col转载 2022-07-10 22:55:49 · 920 阅读 · 1 评论 -
PIL、OpenCV中resize算子实现不同的问题
PIL、OpenCV中resize算子实现不同的问题原创 2022-06-01 15:36:14 · 1162 阅读 · 1 评论 -
图像预处理之warpaffine与双线性插值及其高性能实现
图像预处理之warpaffine与双线性插值及其高性能实现视频讲解:https://www.bilibili.com/video/BV1ZU4y1A7EG代码Repo:https://github.com/shouxieai/tensorRT_Pro本文为视频讲解的个人笔记。warpaffine矩阵变换对于坐标点的变换,我们通常考虑的是旋转、缩放、平移这三种变换。例如将点 P(x,y)P(x,y)P(x,y) 旋转 θ\thetaθ 度,缩放 scalescalescale 倍,平移 ox,o原创 2022-05-06 11:16:57 · 1422 阅读 · 4 评论 -
Segmentaion标签的三种表示:poly、mask、rle
Segmentaion标签的三种表示:poly、mask、rle不同于图像分类这样比较简单直接的计算机视觉任务,图像分割任务(又分为语义分割、实例分割、全景分割)的标签形式稍为复杂。在分割任务中,我们需要在像素级上表达的是一张图的哪些区域是哪个类别。多边形坐标Polygon第一感下,要表达图像中某个区域是什么类别,只要这个区域“圈起来”,并给它一个标签就好了。的确,用多边形来将目标圈出来确实是最符合我们视觉上对图像的感知的方法。并且在很多数据集的标注过程中,来自人类的手工标注也是通过给出一个一个点的坐原创 2022-02-27 21:37:25 · 13643 阅读 · 4 评论 -
利用opencv-python绘制多边形框或(半透明)区域填充(可用于分割任务mask可视化)
利用opencv-python绘制多边形框或(半透明)区域填充(可用于分割任务mask可视化)本文主要就少opencv中两个函数polylines和fillPoly分别用于绘制多边形框或区域填充,并会会以常见用途分割任务mask(还是笔者的猪仔数据集^^)可视化举例示范。cv2.polylines()以下是摘自Ref的函数介绍,笔者将在下面结合例子解释其中的参数。cv2.polylines() method is used to draw a polygon on any image.Synta原创 2021-07-23 16:52:53 · 11147 阅读 · 11 评论 -
视频质量评价:挑战与机遇
视频质量评价:挑战与机遇转自:https://zhuanlan.zhihu.com/p/384603663本文整理自鹏城实验室助理研究员王海强在LiveVideoStack线上分享上的演讲。他通过自身的实践经验,详细讲解了视频质量评价的挑战与机遇。文 / 王海强整理 / LiveVideoStack大家晚上好,感谢参加今晚的分享。我叫王海强,来自鹏城实验室。今天我分享的题目是“视频质量评价的挑战与机遇”。这是今天要分享的内容。首先,我会简单介绍一下什么是视频质量评价及它的分类。第二部分,我转载 2022-02-01 22:47:53 · 510 阅读 · 0 评论 -
详解优酷视频质量评价体系
万字长文 | 详解优酷视频质量评价体系分享嘉宾|李静博士,阿里巴巴文娱集团资深算法专家,阿里巴巴大文娱摩酷实验室视频体验与质量团队负责人整理出品|AICUG人工智能社区本文地址:https://www.6aiq.com/article/1617926511225本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出导读:随着近年来用户在社交媒体/短视频分享平台的重度参与,视频多媒体内容的消费主导从原来的OGC向UPGC转变。因此UPGC图像/视频的质量评转载 2022-02-01 20:55:33 · 1334 阅读 · 0 评论 -
CV中的色彩空间大全
HSI、HSV、RGB、CMY、CMYK、HSL、HSB、Ycc、XYZ、Lab、YUV颜色模型HSV颜色空间HSV(hue,saturation,value)颜色空间的模型对应于圆柱坐标系中的一个圆锥形子集,圆锥的顶面对应于V=1. 它包含RGB模型中的R=1,G=1,B=1 三个面,所代表的颜色较亮。色彩H由绕V轴的旋转角给定。红色对应于 角度0° ,绿色对应于角度120°,蓝色对应于角度240°。在HSV颜色模型中,每一种颜色和它的补色相差180° 。 饱和度S取值从0到1,所以圆锥顶面的半径为1转载 2021-09-04 14:33:26 · 645 阅读 · 0 评论 -
ImageNet 1K 类别名与索引的对应关系
ImageNet 1K 类别名与索引的对应关系转自:http://befree2008.github.io/2018/10/05/20181005_ImageNet1000%E5%88%86%E7%B1%BB%E5%90%8D%E7%A7%B0%E5%92%8C%E7%BC%96%E5%8F%B7/ImageNet 2012 1000个类名称和编号。ILSVRC2012_img_train.tar 这个文件解压出来都是一些nxxx这样的目录,也不知道他对应是哪个类,通过找caffe_ilsvrc12.t转载 2021-12-21 21:27:22 · 7085 阅读 · 1 评论 -
timm 视觉库中的 create_model 函数详解
timm 视觉库中的 create_model 函数详解最近一年 Vision Transformer 及其相关改进的工作层出不穷,在他们开源的代码中,大部分都用到了这样一个库:timm。各位炼丹师应该已经想必已经对其无比熟悉了,本文将介绍其中最关键的函数之一:create_model 函数。timm简介PyTorchImageModels,简称timm,是一个巨大的PyTorch代码集合,包括了一系列:image modelslayersutilitiesoptimizersschedu原创 2021-11-16 20:37:57 · 39188 阅读 · 17 评论 -
图解自监督学习(CV)
图解自监督学习(CV)译自:https://amitness.com/2020/02/illustrated-self-supervised-learning/作者:Amit Chaudhary注:译者在某些地方对原文的表述做了调整,使其适合汉语的阅读习惯,并在某几处有译者自己的理解。大家有能力的话可以看一下英文原文。在 Yann Lecun 的一次演讲中,作者首次了解到了自监督学习,他在那里介绍了“蛋糕类比”来说明自监督学习的重要性。 在谈话中,他说:“If intelligence is a翻译 2021-10-23 17:46:55 · 2767 阅读 · 0 评论 -
FLOPs、FLOPS、Params的含义及PyTorch中的计算方法
FLOPs、FLOPS、Params的含义及PyTorch中的计算方法含义解释FLOPS:注意全大写,是floating point operations per second的缩写(S表second秒),表示每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标。FLOPs:注意s小写,是floating point operations的缩写(s表复数),表示浮点运算数,理解为计算量。可以用来衡量算法/模型的复杂度。Params:没有固定的名称,大小写均可,表示模型的参数量,也是用来衡量算法原创 2021-09-04 19:41:03 · 22921 阅读 · 3 评论 -
图像卷积及其计算(特征图尺寸、参数量、计算量)
图像卷积及其计算(特征图尺寸、参数量、计算量)卷积前后特征图尺寸的计算定义参数如下:输入特征图尺寸: W×WW×WW×W卷积核尺寸: F×FF×FF×F步长: SSS填充的像素数:PPP则有输出特征图尺寸为 N×NN×NN×N:N=(W−F+2P)/S+1N = (W − F + 2P )/S+1N=(W−F+2P)/S+1参数量的计算卷积层的参数量卷积的参数量即卷积核的参数量,设我们有如下参数:卷积核尺寸:KKK前一层的通道数:CinC_{in}Cin当前层的卷积核原创 2021-10-22 16:11:07 · 8135 阅读 · 0 评论