自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 资源 (2)
  • 收藏
  • 关注

原创 yolov5训练出现“gnutls_handshake() failed: Error in the pull function”

现象:

2021-06-18 11:51:58 705 3

原创 自己编译opencv,读视频时出现MFVideoFormat_RGB24(unsupported media type)错误

问题描述,win7下用编译好的opencv340读取视频,可以正常读取,但是用自己编译的opencv451会出现如下问题:出现这个问题的原因是没有编译ffmpeg库,在cmake阶段没有正常下载ffmpeg相关的文件导致的,按照https://blog.csdn.net/star_of_science/article/details/104406819方法手动下载ffmpeg相关文件:重新cmake,然后再编译一下opencv,就可以生成“opencv_videoio_ffmpeg451_6

2021-01-18 13:27:26 485

原创 vs2015\2017\2019不能编译x64问题的解决

一、问题描述最近需要用到C++做项目,PC上还是安装的vs2010,于是准备安装新版本vs,但是安装了vs2015、vs2017和vs2019编译x86正常,均不能编译x64程序,最基本的“hello world”都无法编译通过。系统是win7 64位。网络上也有小伙伴遇到了同样问题:https://bbs.csdn.net/topics/392166381。以vs2019为例:二、解决方案解决时走了一些弯路,最后的问题还是出在了属性配置上面。右键->属性->vc++目.

2021-01-06 11:04:50 4502

原创 LEARNED VIDEO CODEC WITH ENRICHED RECONSTRUCTION FOR CLIC P-FRAME CODING个人理解

文章地址:https://arxiv.org/abs/2012.07462写在前面:本文提出了一个新的基于深度学习的端到端视频编解码框架,与DVC的框架有点相似,但也有几点区别。另外,网络和实验一些关键细节写的很详实。目录一、概述二、论文方法三、实验四、总结一、概述1、本文提出了一种基于学习的P帧编解码框架,对比实验是在CLIC2020 P帧压缩竞赛数据集上进行。2、和DVC一些不同点:(1)基于PWC net改进了运动估计;(2)残差编码基于Balle的框架进行

2020-12-30 10:23:41 597

原创 端到端图像、视频编解码研究者的福音

文章地址:https://arxiv.org/pdf/2011.03029.pdfgithub地址:https://github.com/InterDigitalInc/CompressAI/InterDigital AI Lab做了一个叫做CompressAI的研究平台,基于Pytorch,这是一个提供自定义操作、层、模型和工具以研究、开发和评估端到端图像和视频压缩编解码器的平台,可以降低基于深度学习的图片、视频压缩的入门门槛,方便研究人员。CompressAI有以下几个特点:1、构建端到

2020-11-06 13:19:56 811 2

原创 Learning to Compress Videos without Computing Motion 个人理解

文献地址:https://arxiv.org/pdf/2009.14110.pdf目录一、概述二、文章贡献三、论文思想四、实验五、结论与总结一、概述同样是端到端的利用深度学习来解决视频编解码问题,提供了一个新的思路:不进行运动估计的情况下进行图片压缩。二、文章贡献1、无论输入视频帧的尺寸或所需的压缩率如何,我们框架的所有元素都仅从端到端进行了一次训练;2、创新性地利用位移差异来捕捉运动,避免了运动估计和运动压缩的计算开销;3、组合LTSM-UNet有效地捕获了

2020-10-29 11:06:07 342 2

原创 DVC的Tensorflow实现来了

文献:OpenDVC:An Open Source Implementation of the DVC Video Compression Method文献地址:https://arxiv.org/abs/2006.15862code地址:https://github.com/RenYang-home/OpenDVC又是杨韧的一篇文章,他们已经在知乎(https://zhuanlan.zhihu.com/p/151807493?from_voters_page=true)上有所介绍,对于想研究基

2020-07-05 15:48:54 990 2

原创 python+opencv求协方差

在实际工作中,协方差作为数据的重要统计特征,我们经常会用到。最近在用到opencv_py的cv2.calcCovarMatrix求数据的协方差时就踩了一个小坑,特记录一下。例如,我要求下面数据(每一行是某一图像的CrCb值,一共有几万个数据对,也就是几万个样本)的协方差,数据名字label_pixVale。 …………… ...

2020-06-27 17:31:17 835

原创 Learning for Video Compression with Hierarchical Quality and Recurrent Enhancement 个人理解

CVPR2020又一篇基于深度学习的端到端视频编解码框架。论文链接 https://arxiv.org/abs/2003.01966课题主页 https://github.com/RenYang-home/HLVC个人主页 https://renyang-home.github.io/知乎上已经有人进行解读:https://zhuanlan.zhihu.com/p/120518754。本文的框架虽然是新的,但是从实验结果看,依然只是比H265(x265,Low-Delay P very fa

2020-06-21 16:56:04 1308 2

转载 300+篇CVPR 2020代码开源的论文,全在这里了!

CVPR 2020代码开源项目一放出,得到不少CVers的关注,重点是:开源和根据方向分类。目前star数已经来到2000+,期间也有不少国内外的CVPR 2020论文作者提交issue,分享他们的工作。在此再次更新数据,代码开源的论文突破300+,项目还在持续更新,欢迎补充分享,也推荐大家学习:https://github.com/amusi/CVPR2020-Code注:下面内容很硬核,可以在CVer公众号后台回复:CVPR2020,即可下载如下内容CVPR2020-Code..

2020-06-21 13:35:30 8378

原创 Scale-space flow for end-to-end optimized video compression 个人理解

文献地址:http://openaccess.thecvf.com/CVPR2020_search.py文章中了CVPR2020。一、概述本文提出了一套全新的端到端视频编解码框架。针对现有基于学习的视频编解码需要光流、双线性warping和运动补偿,而且有相对复杂的架构和训练策略(需要预训练光流、训练各个子网络、重建当前帧需要依赖预存的前一帧),本文提出一种广义warping操作,可以处理比如去遮挡、快速运动等复杂问题,而且模型和训练流程大大简化。二、本文贡献本文对现有的基于学习的包含光

2020-06-14 16:50:36 1983 3

原创 M-LVC: Multiple Frames Prediction for Learned Video Compression 个人理解

文献地址:https://arxiv.org/abs/2004.10290代码地址:https://github.com/JianpingLin/M-LVC_CVPR2020文章入选CVPR2020,网络上已经有对本文进行了简单解读(https://blog.csdn.net/moxibingdao/article/details/105804082,https://zhuanlan.zhihu.com/p/136343529),本文是对DVC的改进,因为在实际工作中,我们对DVC也进行了深入了解并

2020-05-31 19:45:02 1509 15

原创 Content Adaptive and Error Propagation Aware Deep Video Compression 个人理解

文献地址:https://arxiv.org/abs/2003.11282。一、概述该文章基于深度学习的端到端视频编解码框框架DVC(https://blog.csdn.net/cs_softwore/article/details/87006743)的后续研究,主要为了解决基于学习的视频编解码的错误传播和视频内容自适应问题问题。错误传播的问题通过在训练阶段考虑连续多帧的压缩来解决,是一个训练策略的改进;本文提出的内容自适应方案,可以根据视频内容在线更新编码器,区别于传统的手工编码模式。二、

2020-05-24 18:18:33 1044

原创 tensorflow模型转caffe模型需要注意的一些点

许多深度学习算法落地阶段,tensorflow训练好的参数需要转换到caffe平台。 我们采用了https://blog.csdn.net/pc9803/article/details/100055213中的半自动话方法,只是其中一些步骤进行了优化。可以肯定的是这种方法完全可行的,我们的模型(有20多层)成功转换后,两个平台模型输出结果的L1 distance为1e-07...

2020-05-02 18:13:02 341

原创 pytorch连续多次推理同样的数据,结果居然不一样?

深度学习中经常会用到反卷积操作,在使用pytorch时,发现如下问题,特做记录。语句1:self.deconv1 = nn.ConvTranspose2d(in_channel, out_channel, kernel_size=4, stride=2, padding=1, output_padding=0, bias=False)语句2:self.deconv1 = nn.Conv...

2020-03-09 18:49:28 3527

原创 Learning Image and Video Compression through Spatial-Temporal Energy Compaction 个人理解

文章发表在CVPR2019,文章地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Cheng_Learning_Image_and_Video_Compression_Through_Spatial-Temporal_Energy_Compaction_CVPR_2019_paper.pdf一、摘要本文最核心的思想就是在图片和...

2019-12-24 16:22:46 687

原创 Neural Inter-Frame Compression for Video Coding 个人理解

本文发表在ICCV2019,论文地址:http://openaccess.thecvf.com/ICCV2019.py一、摘要:(1)本文提出了一个建立在基于深度学习图像压缩基础上的端到端的视频编解码框架。(2)时间冗余通过光流的像素空间中的运动补偿来进行。(3)通过将所需信息编码为运动和混合系数的潜在表示形式,从而提高解码效率和重建质量。二、论文解析1、文献的视频编解码架...

2019-11-26 16:03:41 1070 7

原创 改进的smooth L1损失

smooth L1的定义如下:一般smooth L1用于回归任务。对x求导:smooth L1 在 x 较小时,对 x 的梯度也会变小,而在 x 很大时,对 x 的梯度的绝对值达到上限 1,也不会太大以至于破坏网络参数。 smooth L1 完美地避开了 L1 和 L2 损失的缺陷。最近研究一些图像生成任务(比如视频编解码)时,常用的损失也是MSE和L1。用L1损失时,因为...

2019-10-25 17:25:56 1293

转载 深度学习中的一些基础干货

作者:HarleysZhang来源:2019_algorithm_intern_information @ GitHub,谢谢原作者的分享卷积输出大小计算CNN中术语解释CNN网络的主要参数有下面这么几个:卷积核Kernal(在Tensorflow中称为filter); 填充Padding; 滑动步长Strides; 池化核Kernal(在Tensorflow中称为f...

2019-10-25 13:53:52 3024

原创 Deep Frame Prediction for Video Coding 个人理解

一、文章地址:https://arxiv.org/abs/1901.00062,已经被TCSVT2019接受。二、概述。提出一个DNN网络进行视频编解码中的帧间预测,需要配合H265使用,可以认为是H265的一个补充、一个附加的工具,可以嵌入到H265。论文主要创新点:1、双向和单项预测融合到一个网络中;2、预测帧不需要额外的运动信息,有利于节省码流。三、论文思想:0、网络结构...

2019-08-22 17:00:01 805 3

转载 深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览-转发

转发自https://zhuanlan.zhihu.com/p/55747295谢谢原作者。留下学习一下

2019-03-22 09:00:23 527

转载 深入理解pytorch autograd

学习下,转自https://www.cnblogs.com/hellcat/p/8449031.htmlhttps://www.cnblogs.com/hellcat/p/8449801.htmlhttps://www.cnblogs.com/hellcat/p/8453615.html谢谢原作者的辛苦总结。(上)在PyTorch中计算图的特点可总结如下:autogra...

2019-02-21 09:07:15 1773

原创 DVC:An End-to-end Deep Video Compression Framework 个人理解

我将文档上传到个人百度网盘中了,查看如下:1、链接:https://pan.baidu.com/s/1ja15mdlBjH_MLwdXNnl99g2、微信扫描二维码:  

2019-02-11 17:01:33 3080

原创 卷积神经网络之上采样-pytorch

       利用卷积神经网络进行图像处理(图像超分、图像编码、风格转换、图像语义分割等)时避免不了要用到上采样操作,一般常见的上采样有:      1、传统上采样。pytorch的双线性上采样函数torch.nn.Upsample(scale_factor=scale_factor, mode='bilinear'),参数model为选择的上采样插值算法。      2、反卷积。pyto...

2019-01-22 14:59:42 6997

原创 Video Compression through Image Interpolation 个人理解

通过阅读文献以及复现,有以下几点总结或感受:一、作者提供的源码。地址:https://github.com/chaoyuaw/pytorch-vcii。在复现过程中发现,这份源码中存在一些小的bug,不过修改起来并不困难。二、这是一篇基于深度学习的端到端的深度视频编解码文献。目前这类文献并不多,文章中也有提到说这是第一篇端到端的视频编解码文章。而且视频编解码框架明显区别于传统的H系列的框架...

2019-01-16 18:35:58 2584 7

matlab画二维箭头

matlab固有的画箭头函数使用起来总是不能满足自己的要求,于是动手写了一个函数

2012-04-04

基于opencv的人脸识别

这是基于opencv开发的人脸识别系统,可大大减少程序员的工作量

2010-12-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除