计算机视觉
文章平均质量分 77
Pretender_1
暂无
展开
-
数字图像和视频处理基础学习第一部分笔记
1.The Pinhole Camera在针孔相机模型中,x,y代表着投影在某个平面的位置,而z表示光轴即图像距离相机/小孔的距离。因此,我们的目标就是根据实际物体的x,y,z计算出相机投影平面上物体的x,y;用公式表示就是x=-fX/Z, y=-fY/Z.2.Parallel lines converge to a vanishing point在3-D模型中原本平行的线条在2-D平面上会交汇到...原创 2018-03-23 14:50:00 · 409 阅读 · 0 评论 -
Fundamentals of Image and Video Processing-first week
Introduction to Image and Video Processing1. Analog v.s. Digital Signals 1.1 Signals A function containing information about the behavior or nature of some phenomenon of interest. 1.2 Analog to...原创 2018-03-23 16:21:44 · 347 阅读 · 0 评论 -
论文笔记 Unsupervised Extraction of Video Highlights Via Robust Recurrent Auto-encoders
本文提出了一个视频精彩片段检测算法之前的精彩视频剪辑的方法常用的是处于监督学习或者启发式规则下,本文采用的无监督学习的方法,同时也借助到Youtube上各种各样的用户剪辑过的视频用于训练,同时作者考虑到在用户剪辑过的视频中,精彩部分出现的频率和时长肯定会大于不是那么精彩部分出现的时长。视频的highlights存在着三个巨大的挑战,第一个是尽管大部分人对于highlight有着相同的概念但...原创 2019-02-28 20:28:22 · 720 阅读 · 0 评论 -
Non-negative Matrix Factorization 非负矩阵分解
Non-negative Matrix Factorization 非负矩阵分解Introduction定义 非负矩阵分解(non-negative matrix factorization),或非负矩阵近似(non-negative matrix approximation),是多变量分析和线性代数的算法。给定非负矩阵,求两个非负矩阵和,使得。起源 著名的科学杂志《Nat...转载 2019-02-25 16:50:20 · 4118 阅读 · 0 评论 -
[转发] [ECCV18-行为识别论文笔记] 多纤维网络
原文:https://zhuanlan.zhihu.com/p/46804541代码:https://github.com/cypw/PyTorch-MFNet行为识别/视频分类 是视频理解领域的重要方向。之前该方向的深度学习方法大致可以分为两个大类:一类是双流网络,即以rgb图像和光流图像作为2D网络两个分支的输入,再在网络的某处进行融合,典型的如TSN;另一类则是将多帧RGB图像看做是...转载 2019-02-26 15:31:15 · 477 阅读 · 0 评论