CV
文章平均质量分 78
1LOVESJohnny
这个作者很懒,什么都没留下…
展开
-
CV | Structure-Preserving Super Resolution with Gradient Guidance 基于梯度保留结构的超分算法SPSR学习笔记
1. Present Problems: • However, there are always undesired structural distortions in the recovered images. • While GAN-based methods can generate high-fidelity SR results, there are always geometric distortions along with sharp edges and fin...原创 2021-09-04 22:54:32 · 1298 阅读 · 3 评论 -
CV | EDSR: Enhanced Deep Super-Resolution Network增强深度超分网络的论文学习笔记
.概览EDSR是一篇经典的超分论文,在NTIRE 2017比赛的超分挑战中获胜,并在2017年发表成文。EDSR对后续的超分算法有很重要的影响,至今(2021年)在学术界也常被引用,同时也很受工业界落地需求的欢迎。下面是EDSR的几个主要创新点:.解决的问题.方法.实验结果...原创 2021-09-01 22:32:31 · 2341 阅读 · 1 评论 -
CV | ffmpeg视频解码写入图像文件 根据图像编码写回视频
.背景在计算视觉应用中,经常涉及到以下流程:对视频文件进行抽帧视频帧逐帧进行图像处理再写回视频文件涉及到视频的编解码就绕不开成熟的工具ffmpeg,因为最近经常用到ffmpeg来对视频抽帧、编码写回视频,故用博客记录一下,以便之后反复查看,省去了搜索引擎反复折腾的时间。接下来开始吧!.解码抽帧我的应用场景下需要对视频中所有帧数据进行处理,所以不设置抽帧间隔,使用默认的参数如下:// using ffmpeg to decode a specified video .mp4 file原创 2021-07-14 16:45:33 · 437 阅读 · 0 评论 -
Package | OpenCV C++ cv::Mat 数据类型type对应的输出值
背景:在使用OpenCV C++包时,通常需要访问和修改cv::Mat的数据值。要做到点对点的处理,保证程序的正确性,需要先确定cv::Mat的数据类型type,以确定后续访问cv::Mat数据的调用接口。做法:要确定cv::Mat的数据格式,最直接的做法是调用type API,得到type的输出值。cv::Mat img;/*...image process...原创 2020-04-21 15:18:30 · 3562 阅读 · 1 评论 -
CV | SRGAN论文笔记:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
题外话时隔一年多,距离第一篇SRCNN 超分系列的文章再更新 >.< 随着22个月的过去,超分在工业界的落地趋势逐渐明朗,让我们一起来回顾超分辨率这个领域又一经典里程碑式的方法——基于生成式对抗网络的超分辨率网络 SRGAN。研究背景介绍超分辨率(super resolution)任务的目标是将输入的低分辨率图像,例如256×256的图像,等比例放大若干倍后(如...原创 2020-03-31 22:04:54 · 1341 阅读 · 0 评论 -
Package | OpenCV import cv2报错:找不到libSM.so.6 libXrender.so.1 libXext.so.6
题外话:经常遇到这个问题,每次都google,还是记录一下好了 >.<通常,在一个新的系统环境下,跑CNN或者DL的python代码,会报错找不到cv2 module。环境里没有安装opencv导致的,问题错误通常如下:ModuleNotFoundError: No module named 'cv2'通过pip指令安装opencv-python包即可:pi...原创 2019-12-26 13:30:51 · 2967 阅读 · 0 评论 -
DL | GAN: Generative Adversarial Nets 生成对抗网络算法学习
题外话:本文是生成对抗网络GAN的基础理论学习的笔记,主要是基于Goodfellow于2014年发表的论文Generative Adversarial Nets。话说GAN已经火了这么多年,今天才提笔写笔记真是不好意思,然后刚才突然惊奇地发现,今天是GAN论文release在arXiv上正好整整五年。2014年6月10日,Ian Goodfellow向学术界发表了他同导师头脑风暴之下设计...原创 2019-06-15 22:24:13 · 692 阅读 · 0 评论 -
CV | GauGan 论文学习:Semantic Image Synthesis with Spatially-Adaptive Normalization
题外话:近期英伟达提出GauGAN,附上了炫酷的demo和完整的repo,让人很想试着跑跑看。如论文题目可知,GauGAN算法是一种语义图像合成算法,该算法使用了空间自适应的归一化操作(这个也是本文中最主要的贡献点)。一、摘要作者开门见山指出算法的创新点,提出了一种新的空间自适应归一化层(Spatially-Adaptive Normalization Layer),可以简...原创 2019-06-30 23:36:41 · 4989 阅读 · 1 评论 -
CV | SCNN: Spatial CNN for Traffic Lane Detection 车道线检测算法SCNN“最全的”学习笔记
题外话:可能因为是节假日,所以这篇文章的标题非常的标题党哈哈哈哈哈~ 回归严肃,过去一段时间花了比较多的精力学习这个算法,所以想借此空闲时间,好好总结和复盘一下。感兴趣的朋友们,欢迎评论区讨论,如果有理解不对的地方也欢迎大家指正。前言车道线检测在自动驾驶感知任务中占据重要的一席,它可以辅助自动驾驶的车道保持,同时也可以为车辆定位等工作提供较强的先验信息。目前,常见的方法大抵...原创 2019-04-06 22:35:53 · 8160 阅读 · 39 评论 -
CG | Sky is Not the Limit: Semantic-Aware Sky Replacement 基于语义信息的天空替换算法
题外话:一直声称对CG有兴趣的我,第一次认真地读了一篇CG领域的文章,本文用于记录读论文的心得(碎碎念)。直观的感受是,CG和CV的差异在本文中的体现主要在于CG较CV而言,更偏上层应用,端到端的模型在其中只是一个步骤,好奇CG会不会也被端到端的模式侵袭。不过这篇关于照片中天空替换的算法已经是16年的SIGGRAPH了,比较久远。摘要作为照片中普遍出现的背景——天空,通常不...原创 2021-09-08 00:08:51 · 490 阅读 · 0 评论 -
CV | Fully Convolutional Networks for Semantic Segmentation 全卷积网络FCN在语义分割的应用
FCN网络在图像分割取得里程碑式的成功,并且在工业界应用广泛,很值得学习,以此笔记记录论文的学习过程。 摘要本文的关键创新点之一在于构建“全卷积”(Fully Convolutional)网络结构,该结构的输入可以为任意尺寸大小的图像,并可以生成对应大小的分割结果。稳重给出了全卷积网络的细节定义,并将其迁移到经典的分类网络上,如:AlexNet、VGG、GoogleNet等等。本...原创 2019-01-20 21:37:44 · 566 阅读 · 0 评论 -
CV | Image Super-Resolution Using Deep Convolutional Networks 使用深度卷积网络的图像超分辨率算法
背景介绍:超分辨率的目标是将输入的低分辨率图像(画质较差、像素低)原创 2018-05-13 17:07:00 · 4863 阅读 · 0 评论 -
CV | Face++(旷视)人脸检测API使用笔记
题记:作为最后一个假期的时光,抽空试试看~ 其实是因为一个看不到终点的小project(希望可以check掉^_____________^Face++(旷视科技)的产品近几年受到业界广泛的关注,其应用场景的成熟(如:刷脸)影响着生活形式,也决定着其自身的发展前景。资料和推广就不粘了,大家可以自行搜索。本文的出发点是想记录一下使用其开放api的笔记。旷视官网(API文档链接)上给出的教程很人性化,可...原创 2018-02-28 01:36:28 · 3352 阅读 · 1 评论 -
CV | 智能缩放:浅谈Seam Carving算法 (1)
最近整合任务有点重,所以现在才更= =。之前做过一个图像智能缩放(retargeting)算法的报告,其中主要学习的是Shai于07年提出的Seam Carving,今天在这里复习一下,这个方法已经提出快10年了,所以后续也有很多优秀的算法,欢迎大家一起讨论分享。 1. 传统的图像缩放技术首先介绍算法提出的背景,图像是当代信息传播的重要媒介,然而多种多样的显示设备和应用对图像尺原创 2016-07-14 18:15:51 · 7161 阅读 · 0 评论 -
CV | Interactive Image Segmentation 图割法分割图像
题外话:最近作息有些混乱,再加上下午的讲座,所以。。。昨天居然忘记更 = =,不过好在一切都过去了,慢慢来!回归正常!今天看了一篇文章是关于交互式分割的,所以去谷歌学术搜了下相关文献,就找到了以下:Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images中原创 2016-07-18 23:55:10 · 2759 阅读 · 0 评论 -
CV | Color Cooccurrence Histograms 色彩同现直方图
题外话:今天的雨下了整整一天啊!每年7月20号左右的惯例今天接触到一个概念Color Cooccurrence Histograms(色彩同现直方图),感兴趣上网查了查相关文献,在这里记录一下今天学到的课外知识√。先总结介绍直方图(Histogram)的概念。百度介绍:直方图又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况,一般用横轴表示原创 2016-07-20 23:56:07 · 1266 阅读 · 1 评论 -
CV | Max Flow / Min Cut 最大流最小割算法学习
最大流/最小割(Max-Flow/Min-Cut)算法,因其可以对能量方程最小化进行求解,在计算机视觉(CV)中有很广泛的应用。之前介绍过的Seam Carving算法(用于图像智能缩放),或是图像分割算法中,经常使用最大流/最小割进行能量方程的最小化求解。原创 2016-07-24 22:21:17 · 17020 阅读 · 18 评论 -
CV | SIFTflow 学习笔记
题外话: 这是刘策08年发表论文中提出的方法,比较老,就稠密匹配这块经典,但是网上资料不多,刚开始以为是经典的方法不打算花太多时间读文,想着直接用现成的代码就好,哪知。。。就是这种想法!所以导致效率极其低下,几乎看了整整五六天有没有!而且心情也不好,虽然中间穿插小长假是一部分原因,但是效率总也提不起来。这就是掉以轻心的坏处,以后记住,无论是什么问题还是本着要从根本学会的态度比较好。题外话end原创 2016-07-16 16:33:03 · 8792 阅读 · 2 评论 -
CV | Feature Space Optimization for Semantic Video Segmentation - 基于特征空间优化的视频语义分割
前言:今天分享的这一篇文章是CVPR2016有关视频语义分割方向的,最近才开始学习语义分割相关的文献,有理解偏差的希望大家可以指正。语义分割在维基百科上面没有直接定义,但从字面上就可以理解,就是将图像或视频分割后,并为每一个包含的像素加上标签。下图是《基于特征空间优化的视频语义分割》的插图,可以很好地解释语义分割的含义,左列为输入视频截图,右列为语义分割结果。我们可以看到图中的每一原创 2017-01-02 17:13:41 · 3170 阅读 · 3 评论 -
CV | Semantic Co-segmentation in Videos 视频协同语义分割
前言:这篇文章发表在ECCV2016上,之前读过同一作者的CVPR2016的Object Flow,最近因为做了报告,就顺便整理学习笔记了,欢迎大家一起讨论。视频的协同语义分割这个方向相关的文章还不多,是比较新的研究领域。从字面上理解,即对视频集进行协同分割的同时,进行语义分割,为输出的分割结果添加语义标签。大致效果借用论文里的插图,如下所示。图中对比三个方法的原创 2017-01-05 19:12:40 · 4957 阅读 · 5 评论 -
CV | Fast RCNN 学习笔记
题外话:近期好好学习一下Fast RCNN这篇经典的文章,如有说的不对的地方,欢迎大家讨论。1. 概述:Fast RCNN训练VGG16网络时的速度比RCNN提高了9倍,测试时比RCNN快了213倍,并且获得了更高的精度。与SPPnet算法相比,训练速度提高了3倍,测试提高了10倍,并获得了并SPPnet更高的精度。2. Fast RCNN的结构和训练过程Fast原创 2017-10-17 16:38:31 · 569 阅读 · 0 评论 -
CV | 智能缩放:浅谈Seam Carving算法 (2)
Seam Carving高效的图像智能缩放算法,应该既满足图像几何约束,保留图像的结构信息,同时可识别图像内容以得到重要信息,从而在缩放过程中尽可能保留关键的图像内容。2004年Agarwala等人[6]提出交互式搜索最优缝方法,而后Jia等人[7]提出拖拽式粘贴延展图像方法结合泊松图像编辑技术[8],Rother等人[9]开发了自动拼贴技术能够自动地创建图像集的拼贴图像。但是以上技术没有讨论原创 2016-07-15 09:56:29 · 4305 阅读 · 0 评论