Computer Vision
文章平均质量分 93
superbin
软件工程师
展开
-
Learning Spatio-Temporal Transformer for Visual Tracking——精读笔记
本篇精读笔记,对原文重要部分做了严格翻译,如摘要和总结。对正文部分做了提炼,对重点部分突出标注。对参考文献做了分类。本文内容较长,如果时间有限可以直接跳到感兴趣的小节阅读。原创 2021-12-08 19:40:32 · 2215 阅读 · 0 评论 -
初识DirectML
DirectML是微软发布的一套基于DirectX12的机器学习底层推理API。本文对DirectML做了初步介绍,它的优点来源。和其他推理引擎WinML、ONNXRuntime、TensorRT也做了比较。原创 2021-12-04 22:30:36 · 13329 阅读 · 0 评论 -
Distractor-aware Siamese Networks for Visual Object Tracking——论文精读
近年来,Siamese网络以其均衡的精度和速度在视觉跟踪领域引起了巨大关注。但大多数Siamese跟踪方法所使用的特征只能区分前景和非语义背景。语义背景一直被认为是干扰因素,阻碍了Siamese跟踪器的鲁棒性。本文提出了一种基于干扰感知的Siamese网络,用于精确的长时跟踪。原创 2021-11-30 21:25:02 · 3216 阅读 · 0 评论 -
pytorch模型导出成ONNX格式:支持多参数与动态输入
pytorch格式的模型在部署之前一般需要做格式转换。本文介绍了如何将pytorch格式的模型导出到ONNX格式的模型,以及如何支持多参数的输入与动态输入。原创 2021-11-20 22:08:40 · 18438 阅读 · 6 评论 -
RIFE: Real-Time Intermediate Flow Estimation for Video Frame Interpolation——精读笔记
RIFE是一种用于视频插帧(Video Frame Interpolation, VFI)的实时中间流估计算法(Real-time Intermediate Flow Estimation)。RIFE提出的IFNet神经网络可以由粗到精(coarse-to-fine)直接估算中间流,速度也更快。设计了一种特权蒸馏机制来训练中间流模型,可以大大提高性能。原创 2021-11-13 20:43:44 · 6491 阅读 · 1 评论 -
视频智能插帧:初探
本文简要介绍了从2017年到2021年的视频智能插帧领域的论文。视频智能插帧主要分为两大流派:基于核的方法和基于光流的方法,还有一些其他小众的方法,比如基于阶段的,或者直接合成的。还有一些有趣的工作是将视频插帧和超分、去糊等结合在一起。原创 2021-11-07 12:13:15 · 3113 阅读 · 0 评论 -
Video Frame Interpolation via Adaptive Convolution——基于自适应卷积的视频插帧【笔记】
关键词Video Frame InterpolationFrame InterpolationVideo InterpolationVideo Frame Interpolation via Adaptive Convolution视频插帧一般包括两步:运动估计(motion estimation)和像素合成(pixel synthesis)。本文将这两步合成为一步。用卷积核同时捕捉到输入帧之间的局部运动以及像素合成的参数。我们的方法使用了一个深度全卷积神经网络(deep fully conv原创 2021-10-26 19:49:03 · 1415 阅读 · 0 评论 -
SRCNN中的PSNR计算问题
最近用pytorch训练了一个SRCNN模型,然后在跟原始论文(Learning a Deep Convolutional Network for Image Super-Resolution)中的数据比较的时候,发现差别很大。比如说使用Set5数据集中的baby这张图片,使用Bicubic先缩小两倍,然后再放大两倍,论文里面得到的PSNR是37.07 dB。这跟我用python版本实现得出来的结果差别很大。我使用torchvision.transforms中的Resize方法只得到了35.7453 d原创 2020-12-29 20:49:05 · 1465 阅读 · 0 评论 -
SRCNN笔记二
1. 综述原文:Image Super-Resolution Using Deep Convolutional Networks这一篇与更早之前的另一篇很相似(Learning a Deep Convolutional Network for Image Super-Resolution)。不同之处是,本篇增加了以下几个重点:在非线性映射层(non-linear mapping layer)引入更大的filter尺寸,并探索增加层数。同时处理三个颜色通道, YCbCr或RGB。通过实验证明比单通道原创 2020-12-25 18:04:11 · 356 阅读 · 0 评论 -
SRCNN笔记一
1. 综述原文:Learning a Deep Convolutional Network for Image Super-Resolution文章指出Sparse-coding-based方法中的管线可以等同于一个深度学习网络。在真实图像已知的情况下,评价方法有:PSNR(峰值信噪比), SSIM, multi-scale SSIM, information fidelity criterion(IFC), noise quality measure(NQM), weighted peek sig原创 2020-12-25 17:59:08 · 911 阅读 · 0 评论 -
pytorch清华镜像安装
由于国内直接安装pytorch会很慢,而且容易出错,所以一般会采用清华镜像安装速度会快很多。详细步骤直接引用自这里:https://mirror.tuna.tsinghua.edu.cn/help/anaconda/步骤一:修改.condarc文件在“C:\Users\用户名” 目录下找到.condarc文件,将下面的内容拷贝到这个文件。如果没有这个文件,可先执行conda config --set show_channel_urls yes生成该文件之后再修改。channels:...原创 2020-11-21 09:43:26 · 3570 阅读 · 1 评论