自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(107)
  • 收藏
  • 关注

原创 强化学习学习笔记-李宏毅

refhttps://www.youtube.com/watch?v=OAKAZhFmYoI&ab_channel=Hung-yiLee

2024-05-22 18:04:37 263

原创 Inf-DiT: Upsampling Any-Resolution Image with Memory-Efficient Diffusion Transformer

B×Bx∈RH×W×Cxb​∈Rh×w×B2×Czijn​ijPi​ON2)ON。

2024-05-21 22:21:31 204

原创 TikTokActions: A TikTok-Derived Video Dataset for Human Action Recognition

人体行为识别数据集:283,582个视频片段,包含386个类别,从tiktok收集而来;现有的人体行为识别数据集:– UCF101:https://arxiv.org/pdf/1212.0402– HMDB-51:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6126543– Kinetics Human Action Video dataset:https://arxiv.org/pdf/1705.06950– Som

2024-05-20 10:04:00 122

原创 Dive into Deep Learning-优化算法(2)

fR→Rfxϵfxϵf′xOϵ2)η0ϵ−ηf′x)fx−ηf′x))fx−ηf′2xOη2f′2x))ηf′2x0ηfx−ηf′x))fx)x←x−ηf′x)fx)ηxx1​x2​⋯xd​TfRd→R∇fx∂x1​∂fx​∂x2​∂fx​⋯∂xd​∂fx​TfxϵfxϵT∇。

2024-05-14 11:18:11 567

原创 Arbitrary-Scale Image Generation and Upsampling using Latent Diffusion Model and Implicit Neural Dec

CVPR2024问题引入本文introduction部分描述逻辑较为混乱,创新点不是很足,但是整体提炼一下分为两点,其一是改进IDM,使得过程更加efficient,也就是在latent space进行diffusion并且将隐式解码提到diffusion过程之后;其二是同时实现任意尺度超分任务和图像生成任务;其实本质上只有efficiency这一个创新点,原先IDM就是一个以LR+scale为条件的diffusion model,可以实现任意尺度的超分任务,图像生成就没有LR作为条件;所以

2024-05-11 10:57:25 150

原创 SwinIR: Image Restoration Using Swin Transformer

ILQ​∈RH×W×Cin​3×3HSF​⋅)F0​∈RH×W×CFDF​∈RH×W×CFDF​HDF​F0​)HDF​⋅)KIRHQ​HREC​F0​FDF​)IRHQ​HSwinIR​ILQ​ILQ​L∣∣IRHQ​−IHQ​∣∣1​H×W×CM2HW​×M2×CM2H。

2024-05-10 14:58:44 794

原创 Local Texture Estimator for Implicit Representation Function

ILR∈RH×W×3→IHR∈Rry​H×rx​W×3sxILR;Θ∑j∈J​wj​fθ​zj​x−xj​)zEψ​ILR)x−xj​sxILR;Θψ∑j∈J​wj​fθ​hψ​zj​x−xj​))ha​⋅RC→R2Khf​⋅RC→RK×2hp​⋅R2→RKδx−。

2024-05-10 12:17:33 811

原创 Interpreting Super-Resolution Networks with Local Attribution Maps

I∈RdSRd→RAttrS​Rd→RdGradS​I∂I∂SI​I⊙∂I∂SI​(I−I′⋅∫01​∂I∂SI′αI−I′))​dαI′FRh×w→Rsh×sws(xy)l×lDxy​Rl×l→RDxy​I∑i∈xxlj∈yyl​∇ij​II′I′wσ⊗IDFI))γα01。

2024-05-10 11:31:05 437

原创 GDAL的使用

【代码】GDAL的使用。

2024-05-09 17:21:34 249

原创 Meta-SR: A Magnification-Arbitrary Network for Super-Resolution

IHRILRFLRr(inCoutCkkinCoutC(ij)(i′j′Tij(⌊ri​⌋⌊rj​⌋)Wijψvij​;θ)Wij​(ij)vij​ri​−⌊ri​⌋rj​−⌊rj​⌋r1​)θ(ij)(i′j′。

2024-05-09 12:27:46 708

原创 Dive into Deep Learning-优化算法(1)

也就是对应一个矩阵的乘方进行特征值分解,只需要将特征值进行同样的n次方即可,此时n需要时正数;,可以看到对矩阵的逆进行特征值分解,直接对特征值求逆即可;矩阵的行列式等于矩阵的特征值的乘积。iii. 延续上面的例子,特征向量组成的矩阵。矩阵的秩等于非0特征值的个数;是可逆的,所以等式两边同乘。i. 特征值和特征向量,对应的两个特征向量是。

2024-05-08 21:18:11 685

原创 Learning Continuous Image Representation with Local Implicit Image Function

Ii)Mi∈RH×W×Dfθ​sfθ​zx)szxxq​Iixq​fθ​z∗xq​−v∗)z∗v∗Iixq​∑t∈00011011​SSt​​⋅fθ​z∗xq​−v∗)Mi→Mi)3×3Mjki​Concat({Mjlkmi​lm∈−101​)sfcell​zxc])xhr​sh。

2024-05-08 19:49:28 804

原创 Perception-Oriented Single Image Super-Resolution using Optimal Objective Estimation

TB​Cψ​x)xTB​y​TB​​Gθ​x∣TB​)Lrec​Lperl​​λi​∈R7ABλ。

2024-05-07 13:23:09 678

原创 Implicit Diffusion Models for Continuous Super-Resolution

xi​yi​)spyit−1​∣yit​xi​)y0yTf0f0suh。

2024-05-07 10:45:39 708

原创 Activating More Pixels in Image Super-Resolution Transformer

ILR​∈RH×W×Cin​conv×1shallowfeatureextraction​F0​∈RH×W×CresidualhybridattentiongroupsRHAG×nconv×1deepfeatureextraction​FD​∈RH×W×CF0。

2024-05-06 11:16:01 883

原创 Super Resolution in CVPR2023

标题链接Perception-Oriented Single Image Super-Resolution using Optimal Objective Estimationhttps://cvpr.thecvf.com/virtual/2023/poster/22477Super-Resolution Neural Operatorhttps://openaccess.thecvf.com/content/CVPR2023/papers/Wei_Super-Resoluti

2024-05-05 19:11:22 306

原创 Unsupervised Real-world Image Super Resolution via Domain-distance Aware Training

Yryir​i1N​Xrxir​i1M​DSNSRNyig​DSNxir​){yig​xir​i1M​xir​yig​Lcon​Exr​∣∣yib​−DSNxir​∣∣1​Lper​Exr​∣∣ϕyib​−ϕDSNxir​))yib​xir​ϕLHHLHHLadvD​−Eyr​lo。

2024-04-23 17:15:52 527

原创 Unpaired Image Super-Resolution using Pseudo-Supervision

LR→cleanLRcleanLR→HRx∈Xy∈YXYFXY​X→Yy↓​∈Y↓​FXY​GXY↓​​UY↓​Y​LR→cleanLRGXY↓​​GY↓​X​cleanLR→HRUY↓​Y​y↓​∘​GXY↓​​∘GY↓X​y↓​)UY↓​Y​GXY↓​​x)y↓​∘​。

2024-04-23 13:58:27 617

原创 To learn image super-resolution, use a GAN to learn how to do image degradation first

lαlpixel​βlGAN​lGAN​Ex∼Pr​​min0−1Dx))]Ex∼Pg​​min0−1−Dx))]Pr​Pg​lpixel​WH1​∑i1W​∑j1H​FIhrij​−GθG​Idij​2。

2024-04-22 16:47:38 326

原创 Unsupervised Image Super-Resolution using Cycle-in-Cycle Generative Adversarial Networks

LR→cleanLRcleanLR→HRXxi​∈XYyi​∈YZzi​∈Zyi​zi​LR→cleanLRG1​G2​D1​LGANLR​N1​∑iN​∣∣D1​G1​xi​))−1∣∣2​xyG2​LcycLR​N1​∑iN​∣∣G2​G1​xi​))−xi​∣∣2​Lidt。

2024-04-22 15:11:24 860

原创 优化器汇总

https://zhuanlan.zhihu.com/p/55150256https://pytorch.org/docs/stable/optim.html#

2024-04-21 21:24:59 116

原创 损失函数汇总

在多分类问题中,KL(Kullback-Leibler)损失通常用于衡量模型预测的概率分布与真实标签的概率分布之间的差异。在多分类任务中,通常使用交叉熵损失(Cross Entropy Loss)作为主要的损失函数,但KL损失可以作为附加的损失函数或正则化项来提供额外的信息,尤其在一些特定场景下。假设有一个多分类任务,模型预测的概率分布为Q,真实标签的概率分布为P。KLP∣∣Q∑Pi​∗logQi​Pi​​其中,Pi​和Qi​。

2024-04-21 20:47:48 977

原创 Batch Normalization

【代码】Batch Normalization。

2024-04-21 17:41:41 589

原创 Boximator: Generating Rich and Controllable Motions for Video Synthesis

vvSelfAttnvvvTSSelfAttn([vhbox​]))vvCrossAttnvhtext​)tb​MLPFourier([bloc​bid​bflag​]))

2024-04-21 16:45:09 678

原创 Direct-a-Video: Customized Video Generation with User-Directed Camera Movement and Object Motion

同时支持object movement和camera movement。

2024-04-21 16:35:27 667

原创 Motion-I2V: Consistent and Controllable Image-to-Video Generation with Explicit Motion Modeling

分为两个阶段{f0→i​∣i1...N}f0→i​∈R2×H×Wp∈I2pi′​pf0→i​p)z∈R1N×Cl​×hl​×wl​z0∈R1×Cl​×hl​×wl​z1N∈RN×Cl​×hl​×wl​{f0→i​∣i1...N}zi′Wz0f0→i​)zavg​z0z1′z。

2024-04-21 11:44:46 851

原创 VideoComposer: Compositional Video Synthesis with Motion Controllability

t​ϵθ​zt​ctϵθ​zt​c1​twϵθ​zt​c2​t−ϵθ​zt​c1​t))c1​c2​c2​−c1​c2​c1​。

2024-04-21 11:08:21 692

原创 DRAGNUWA: FINE-GRAINED CONTROL IN VIDEOGENERATION BY INTEGRATING TEXT, IMAGE, ANDTRAJECTORY

control包含text,image和trajectory。

2024-04-21 10:53:09 733

原创 MotionCtrl: A Unified and Flexible Motion Controller for Video Generation

提出一个模型同时考虑到object motion和camra motion,分别对应着OMCM module和CMCM module,因为缺少同时包含text\trajectory\camera pose的数据,所以本文使用的是一个multistep的训练策略。

2024-04-21 10:18:56 883

原创 Blind Image Super-Resolution: A Survey and Beyond

TPAMI2023问题定义。

2024-04-18 20:30:03 571

原创 sora related

sora可以生成变长的、不同分辨率的最长可到1分钟的视频;整体流程是videocompressionnerworkvideo→latentpatchifyspacetimepatchesdiffusiontransformerdecoderlatent→videovideocomp。

2024-04-18 15:35:34 1005

原创 通用视觉大模型调研

humanbenchHumanBench: Towards General Human-centric Perception with Projector Assisted Pretraining;为了解决不同任务之间的conflict以及不同dataset之间的差异(相同任务),提出PATH,backbone是所有任务共享、projector是任务级别共享的、head是dataset级别共享的,也就是普通多任务+task specific projector+dataset specific hea

2024-04-16 16:36:13 799

原创 Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data

创新点问题引入MethodyknnD实验。

2024-04-16 09:57:17 320

原创 Deep Learning for Single Image Super-Resolution: A Brief Review

由LRyyy恢复HRxxxkkk表示卷积核,↓s↓s​表示下采样操作,nnn表示噪声;本综述主要针对深度学习的方法指标:数据集:ImageNets。

2024-04-15 16:35:44 764

原创 自然语言处理学习笔记-lecture10-机器翻译01

rule based机器翻译方法

2022-12-22 10:35:02 1067 1

原创 图像处理学习笔记-10-图像分割与边缘检测

图像分割与边缘检测相关内容

2022-12-10 14:40:47 947

原创 法语初级学习笔记-04-单词

法语课程上新学的单词

2022-11-09 16:49:02 2588

原创 法语初级学习笔记-03-疑问句

法语疑问句

2022-11-09 16:34:31 1316

原创 法语初级学习笔记-02-动词变位

法语动词变位

2022-11-09 16:34:07 1680

原创 图像处理学习笔记-09-形态学图像处理

形态学图像处理

2022-11-07 21:03:14 965

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除