![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
小鬼逐梦
文章平均质量分 95
萧班
挥斥方遒,大展身手!
展开
-
Image Shape Manipulation from a Single Augmented Training Sample
Profile\mathbf{Profile}Profile直接上图好吧,????,本文要实现的任务:1️⃣ 只使用一组图像对 (a),(b)(a), (b)(a),(b) 作为训练数据,其中称 (a)(a)(a) 为元素图像(Primitive Image\mathbf {Primitive~Image}Primitive Image),称 (b)(b)(b) 为目标图像(Target Image\mathbf{Target~Image}Target Image)原创 2021-09-22 20:28:43 · 571 阅读 · 0 评论 -
Globally Optimal Toon Tracking
最近看了师公的一篇文章,果然偶尔看看传统算法的文章,才能对问题的本质有深刻的理解,特此记录,敬畏前人。该任务的可视化例子如下:????原项目地址1. Optical Flow 不能用于赛璐璐(cel)动画的原因1️⃣ 不能保证动画的内容(运动)是物理上正确的;2️⃣ 对象运动更剧烈(Choppy & Vigorous);3️⃣ 动画对象缺乏充足的纹理。2. 任务难点1️⃣ 存在多个外形(Appearance)相似的区域(Region);2️⃣ 某个 Region原创 2021-09-16 20:28:16 · 222 阅读 · 0 评论 -
Anycost GANs for Interactive Image Synthesis and Editing
Profile\rm ProfileProfile平日里我们使用 Pr\rm PrPr、Ae\rm AeAe 做视频的时候,预览模式可以选择分辨率 {full,1/2,1/4,etc.}\rm \{full, 1/2, 1/4, etc.\}{full,1/2,1/4,etc.},便于适应不同的边缘设备、模型复杂度下的实时预览和流畅的人机交互操作。这篇文章首次将 Preview\rm PreviewPreview 应用到了基于 GAN\rm GANGAN 的图像编辑任务中——大规模的生成网络如 Sty.原创 2021-03-25 14:57:47 · 1056 阅读 · 5 评论 -
想在 Ubuntu 上放飞梦想的小黑菜(1)
1. Ubuntu 重启后只有一个贼丑的分辨率2. 安装 driver.runsudo sh NVIDIA-Linux-x86_64-440.31.run --no-opengl-files –no-x-check –no-nouveau-check3. 安装网卡驱动原创 2020-11-12 11:36:19 · 391 阅读 · 3 评论 -
论文笔记:Contrastive Adaptation Network for Unsupervised Domain Adaptation
1. 任务设置Unsupervised Domain Adaptation for ImageClassification\rm Unsupervised~Domain~Adaptation~for~Image ClassificationUnsupervised Domain Adaptation for Imag...原创 2020-03-14 18:33:27 · 2674 阅读 · 2 评论 -
论文笔记:Cluster Alignment with a Teacher for Unsupervised Domain Adaptation
Profile 最近因为个人需要看了一些 DADADA 和 DRDRDR 的文章。 这篇文章比较有意思的是:将聚类设计成目标函数,从而一方面实现经网络抽取特征在分布上的自然聚类,一方面因为特征分布的聚类自然提...原创 2020-02-20 15:21:53 · 1529 阅读 · 1 评论 -
论文笔记:Conditional Coupled Generative Adversarial Networks for Zero-Shot Domain Adaptation
本文提出了一个比较有趣的 ZSDAZSDAZSDA(zero-shot domain adaptation) 的学习策略。假如现在我们有两个 UIT(Style Transfer)UIT(Style~Transfer)UIT(Style Transfer) 的任务,原本我们可以构建两个 CycleGANCycleGANCycleGAN 就可以解决上面的问题,或者把数据混...原创 2020-02-01 15:00:04 · 1056 阅读 · 0 评论 -
关于深度网络自学习attention mask的随笔
Attention 的出发点是学习一个 scale ,对深度网络的中间特征做线性激活,即:对特征中有利于目标任务(如正确分类)的部分作增强(a>1a>1a>1),对特征中不利于或无关目标任务的部分做抑制(a<1a<1a<1)基于CAM(Class Activation Mapping)的注意力机制借助一个辅助分类器,在 [conv]* -> ...原创 2020-01-18 00:17:01 · 1601 阅读 · 0 评论 -
Analyzing and Improving the Image Quality of StyleGAN
前言本文围绕2019年上半年的工作 StyleGAN 存在的两个问题进行讨论:Blob Artifacts(液滴伪像);Shift Invariance(切变不变性)。为了解决这两个问题作者提出了一系列的假设、分析和解决方法。明确 StyleGAN 的问题首先我们需要明确上面提到的两个问题分别是什么?Blob ArtifactsShift Invarianc...原创 2019-12-15 16:04:01 · 3324 阅读 · 3 评论 -
CariGANs: Unpaired Photo-to-Caricature Translation
2018年SIGGRAPH的一篇文章,原文见:CariGANs: Unpaired Photo-to-Caricature Translation。由于时间的关系,小编这里也只贴了我的PPT,完整PPT可以私聊我哈!1.要解决的问题2. 基本思路3. 数据集准备这里有两个主要的问题——1)为什么要自己标记,不用现成state-of-the-art的模...原创 2019-06-30 18:56:16 · 1087 阅读 · 21 评论 -
致敬GAN与我最喜欢的框架pytorch
小编从17年暑假开始进入实验室学习,自学了深度学习与机器学习,但理解并不深刻;18年暑假开始从一个师姐手中接下一个课题“线条简化”,但其实做的工作主要是数据集标注与跑实验,尽管最后稍稍改些代码并在论文里提供了几张图,最后的犒劳是“五作(仵作)”;好吧,果然人还是要强大起来,才能获得主动权;19年已经过去了一半,小编才在前不久才更深层次理解了GAN与基于pytorch的实现,复现了2018年传说中的...原创 2019-07-15 22:03:19 · 1479 阅读 · 0 评论 -
EDVR——代码调试+训练
2019年CVPR的文章EDVR: Video Restoration with Enhanced Deformable Convolutional Networks,做的是视频处理(包括视频帧的超分辨率技术与去模糊),从结构上看能够处理应用于任意书品转换的强监督任务;文中最亮眼的地方在于他提出了保证时序一致性(temporal consistency)的新方法,不是使用光流(optical fl...原创 2019-07-18 13:58:25 · 8962 阅读 · 14 评论 -
EDVR工程代码调试+训练(详细版)
好的,受委托于一个朋友,小编在本文将会以第一人称详细记录EDVR的代码跑通过程。1. 环境配置基于virtualenv的虚拟环境配置见博文vid2vid 代码调试+训练+测试(debug+train+test)(一)测试篇。2. 下载代码$ git clone https://github.com/xinntao/EDVR.git$ cd EDVR这之后我们会处于“…...原创 2019-07-26 10:20:41 · 6195 阅读 · 48 评论 -
U-GAT-IT
论文原文:U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation一、解决的问题——unpaired image-to-image translation1.Selfie2Anime...原创 2019-08-10 18:44:59 · 6691 阅读 · 15 评论 -
CNOCR重训练
前不久在实验室接手一个项目,与甲方几经周旋后给了一个接口,核心部分是yolo3的文字检测与cnocr的文本识别。在文本识别中,由于给的预训练的模型的训练数据集与项目应用的数据分布差距较大(最明显的是识别字符的范围不同),可能需要对模型重新训练。为应对甲方朋友的一时兴起,特意花了一个下午搞清楚如何重新训练。特撰写此博客以作记录。一、重训练cnocr的理由"""识别范围不同,cnocr提供...原创 2019-08-25 23:38:33 · 5955 阅读 · 8 评论 -
论文笔记:Large Scale GAN Training for High Fidelity Natural Image Synthesis
进入正题之前,UP主想要吐槽一下,关于这篇文章的很多博客好多人都是直接记录了前面的部分; 即作者介绍的5个tricks用于高清图像256×256甚至是512×512,然后给了一堆结果。 就完了,。那后面的讨论分析呢?? 本着一探究竟的蛮劲,UP主特意花了一天的时间去读了这篇博客(这里倒是挺好奇,其他道友读论文的花费时长的●_●) 进入主题,下面我们根据文章的组织路线来解读这篇文章。...原创 2019-10-07 20:34:10 · 752 阅读 · 0 评论 -
Image Generation from Layout
2019年CVPR的一篇文章,原文见:Image Generation from Layout,代码见:Codes & Demo。为了节省时间,小编这里仅放PPT的插图。完整ppt可以私我哈!1)要解决的问题2)任务的难点3) 关键技术:将具体对象的表示方式解耦,分为确定性的表征基本类别的部分与不确定性的表征具体外观表现的部分。4)合成流程(测试阶段)...原创 2019-06-12 12:34:01 · 1679 阅读 · 10 评论 -
论文笔记:Eye In-Painting with Exemplar Generative Adversarial Networks
先发一张美美的图片! 这篇文章的工作出发点是补救那些人在拍照时不小心眼睛闭上而得到的照片,可以说是“开眼”啦~ 这里先简要介绍这项工作: 1)目的:让照片中闭眼的人物睁开双眼; 2)网络框架:生成拮抗网络(GAN),本文提出了ExGANs. 3)基本思路:基于照片补全(Image Completion)的思想,将照片中人物的“闭眼”先定...原创 2018-06-21 09:21:30 · 2178 阅读 · 4 评论 -
基于python-flask搭建后台,HTML+CSS+JS(jQuery)写前端的web全栈开发(一)
写在前面 因为实验室最近在开发一个网站,所以上个星期就几个人在一块,从〇开始,自学了简易的web全栈开发,也着实走了很多的弯路哈!在此以博客形式记录,谨以此分享给跟兴趣的伙伴们!也希望大伙多多指教!需要准备什么? 首先,我们务必理解:1)什么是前端;2)什么是后端! 我们举一个例子:如上图所示是百度首页!我们输入一个HTTP地址后登录一个网站,所看到的“界面,文本,图片,动画,声...原创 2018-07-15 15:38:59 · 14625 阅读 · 4 评论 -
基于python-flask搭建后台,HTML+CSS+JS(jQuery)写前端的web全栈开发(二)——2.1 前端细节讲解
在正式开始之前,我想跟大家分享一下我的开发思路。 1. 首先,要有一个明确的Project的文件结构,包括文件文件夹命名、归并等。如下图是小编本次项目的结构: (1)总的项目名称是“OLab”(Our Lab的意思)。 (2)“OLab”含有两个文件夹:“Materials”和“src”,前者是一些实验室的资料,例如开发要求、设计方案、辅助照片等,这个不用管;后者...原创 2018-07-15 17:00:48 · 19607 阅读 · 1 评论 -
基于python-flask搭建后台,HTML+CSS+JS(jQuery)写前端的web全栈开发(二)——2.2 前端动画轮播图实现
在我们浏览过的大多数网页中,轮播图基本上是随处可见的,主要用于网站Home页,作为前端技术的一种,目的是通过简易的动画效果和绚丽的图片吸引用户的眼球!轮播图的效果更是多种多样;在本文,小编主要想分享的是比较基本的版本,因为小编也还只是个小白,刚接触过一个星期;但效果上来看是没问题的!步入正题1. 轮播图的原理 其原理是:将一系列待zhan 我们先在上次讲的“templa...原创 2018-07-15 23:05:14 · 3482 阅读 · 3 评论 -
基于python-flask搭建后台,HTML+CSS+JS(jQuery)写前端的web全栈开发(三)——3.1 uploadfiles上传图片到后台(显示进度)处理并返回显示
前面小编说这个项目有两个页面,一个是sketch.html定义的介绍实验室项目(包括abstract,paper,framework,code,results等)的纯前端页面;另一个则是demo.html定义的用户成果体验页面。 通过点击在sketch.html里的按钮进入另一个页面,要怎么实现呢? 上图是sketch.html里的页面跳转按钮! 其定义代...原创 2018-07-16 02:10:09 · 4597 阅读 · 11 评论 -
基于python-flask搭建后台,HTML+CSS+JS(jQuery)写前端的web全栈开发(三)——3.2 普通按钮点击事件与后台交互
在上一篇文章,我们讲解了基于插件实现的上传图片到后台处理,并将处理后得到的结果图与原图在前端显示。 主要idea是将图片先在后台进行缓存,我们传回两张图片的途径,在file的done函数中对<img/>标签的src属性进行更新。 但是这样子存在一个问题,就是后台“static/temp/left(right)”文件夹里的图片会越来越多。 这时候就是那个subm...原创 2018-07-16 10:27:45 · 6226 阅读 · 6 评论 -
论文笔记:Visual Attribute Transfer through Deep Image Analogy
这是一篇讲解图像类比(Image Analogy)的文章。给定一组图片:A和B'。A提供语义Semantic(“是什么”)和内容Content(如图片的哪个位置会有这个object的什么,其形状和大小是怎样的)两大主要信息,B'则主要提供外观性Appearance(如颜色、光照、风格)和细节(主要是纹理)两个大信息。接下来,我们要做的就是把两张图片都划分为固定大小的patch,然后把色...原创 2018-09-16 12:43:17 · 2972 阅读 · 0 评论 -
论文笔记:Progressive Attention Guided Recurrent Network for Salient Object Detection
标题翻译:基于渐进式注意力指导循环网络的显著性目标检测。梗概:这是一篇结合了注意力机制、循环神经网络、CNN来解决显著性目标检测问题的文章,文中提出的对深度卷积网咯的感知特征做另一种方式的自顶而下(top to shadow)的反馈操作是非常新颖的。关于此文的论文原文与小编的阅读注释,与讲解PPT见:链接:https://pan.baidu.com/s/1KGHrY7deAGdQ6dU...原创 2018-09-25 21:55:02 · 2834 阅读 · 1 评论 -
vid2vid 代码调试+训练+测试(debug+train+test)(一)测试篇
## Prerequisites- Linux or macOS- Python 3- NVIDIA GPU + CUDA cuDNN- PyTorch 0.4但一般的话我们为了保护已有的环境,通常对于每一个项目新建一个虚拟环境,过程如下:""" Linux 下安装虚拟环境 """# 升级 pippip install --upgrade pip# 安装必要的库sudo...原创 2019-04-16 14:21:36 · 6969 阅读 · 44 评论 -
vid2vid 代码调试+训练+测试(debug+train+test)(二)训练篇
### Training### Training with Cityscapes dataset- First, download the FlowNet2 checkpoint file by running `python scripts/download_models_flownet2.py`.- Training with 8 GPUs:(惹不起惹不起)- We adopt ...原创 2019-04-16 19:54:59 · 4604 阅读 · 27 评论