童、一-CSDN博客

1.这周把cifar10和celebA跑了一下，cifar10的结果不用ema是由于以前DViTGAN的结果，但是由于保存权重的代码有一行写错了，无法测试FID和IS，所以又重新跑了一下，目前还没有跑完。celebA暂时只跑了22w轮，但是目前的IS已经优于DViTGAN，FID还有一点差距。2.这周把移动进行数据展示的工作完成了。

2024-09-07 02:55:24 260

原创【无标题】

1、新改的模型FID在40左右，目前正在往两个方向改，一是降低加噪强度，二是改代码。2、移动的新需求目前还没做好，因为数据有点多，数据展示时效性有点高，暂时还没弄好。

2024-08-24 02:15:12 239

原创第一百周周报

2、论文按照邮件的要求修改好了格式，新开始的实验暂时还没有跑完，因为中间又有两天服务器关了。1、本周将移动的项目部署好了，吉安小程序按照政府的要求新加了功能。

2024-08-17 00:45:04 174

原创第九十九周周报

这周主要在移动配服务器，由于不太熟悉系统，所以花了很多时间，其他就是在改论文和回复。服务器由于开的节点太少了一直抢不到，所以跑不了模型。

2024-08-10 01:51:51 248

原创第九十八周周报

这周主要在按照审稿人的意见修改论文，由于有个模型保存的文件找不到了，所以重新训练花了点时间，目前已经把修改后的论文和cover letter发给杨老师了。

2024-08-03 22:31:19 274

原创第九十七周周报

这周科研暂时没有进展，因为服务器这周都进不去，周一的时候上周跑的节点还被停了（机房太热），然后这周主要在改吉安县小程序的bug，因为要上线了又暴露出比较多以前没有测到的问题。

2024-07-27 00:53:21 306

原创第九十六周周报

2、新的实验已经把代码改好在训练了，fid已经降下来。1、完成论文的rebuttal。

2024-07-20 01:02:04 329

原创第九十五周周报

这周改了模型，目前能跑且loss稳定，但是fid降不下去，正在找原因。周三展示了demo，目前正在等待通知。

2024-07-13 00:14:01 273

原创第九十四周周报

本周跑完了consistency-gan的实验，结果与论文基本一致。本周完成了demo，下周一去省政府演示。

2024-07-06 01:00:14 328

原创第九十三周周报

项目需要的demo目前基本完成，已经实现所有摄像头的拉流转换推流并分析功能。上周请假回家了没看实验，服务器断了这周又重新跑了。

2024-06-29 00:57:42 340

根据给定的ODE，可以将数据平滑的转换为噪声，简单来说就是从原始图像到某个加噪图像，每一个步骤加的噪声都是特定的，一旦轨迹确定了，则对应的加噪图像也会被确定，反之亦然。与Diffusion Model的随机采样不同，Consistency Model 要求训练出来的模型对于一个采样路径上的每个点都保持 consistency，即预测结果保持一致。目前项目已经完成不同格式流到rtsp流的转换，并往旷视的Ai盒子推流，这两天把保存数据的完成就可以完成初步的demo。为了提升图像采样质量，可以使用多步采样。

2024-06-15 01:26:59 296

原创第八十九周周报

以保证方向最优性，同时保持可分离性。

2024-06-01 01:11:00 504

原创第八十七周周报

这周前面两天在给本科生改论文，后面几天重新画了一下论文的图，然后根据TCSVT期刊模板修改了论文，目前还剩下作者简历没弄好。

2024-05-18 01:43:48 290

原创第八十六周周报

上周由于256分辨率太大的原因没有将stable diffusion和vqgan跑起来，这周将分辨率改到32。同时这周新跑了一个lsun_bedroom64数据集。这周继续润色了一下论文，修改了一些细节并重新画了一下模型结构图。

2024-05-11 01:15:14 287

原创第八十四周周报

这周根据杨老师的建议重新修改了rebuttal和论文，另外对论文进行了翻译。

2024-04-26 23:46:52 210

原创第八十三周周报

这周根据老师的意见重新修改好了论文，然后在ccfddl和其他人的论文中找了一些可以发的期刊。

2024-04-20 01:41:41 364

原创第八十二周周报

这周修改在杨老师指导下修改好了论文，另外更新一下CelebA64的结果，FID到了7.27，IS为2.38。

2024-04-13 00:42:12 318

原创第八十周周报

实验上，dit的cifar10数据集试了很多参数都没调出来；定性实验由于ViTGAN设置随机种子的代码是错误的（之前没注意到，只是将随机种子改为相同的），所以又改了一下重新跑。另外我注意到ViTGAN和ContraD中的定性实验图像也没有固定随机种子（定性实验对比的图像不一致）。这周主要在改论文，已经改好了中文和英文版本。

2024-03-30 01:28:56 244

原创第七十八周周报

目前stylegna2、diffusion-stylegan2、U-ViT的实验以及ViTGAN cifar10的定性试验已经完成，还剩CelebA64的定性实验，以及DiT的实验。DiT模型改完后使用cifar10数据集训练测出来的fid为58，is为6.7。由于作者未使用cifar10数据集，只有256和512分辨率的参数，所以正在对其进行调参。

2024-03-15 22:10:09 323

原创第七十七周周报

diffusion-stylegan2本来已经跑出来结果，并且与DViTGAN一样，加扩散比stylegan2效果好，但是周四结果被我不小心删了，只能又重新跑一份，目前来看可以重新复现出来。UViT已经跑出来结果，fid3.36，由于代码参数不一致，Transformer的参数无法修改成一致的，就只能用原模型跑。DiffT的代码暂时还没改好。

2024-03-09 02:07:34 296

原创第七十六周周报

仔细看了论文"All are Worth Words: A ViT Backbone for Diffusion Models"，”DiffiT: Diffusion Vision Transformers for Image Generation“，“Scalable Diffusion Models with Transformers”。第一个是Contrad中的stylegan2，目前已经跑完，修改好了代码在跑diffusion-gan；都可以单独跑stylegan2。

2024-03-02 00:29:32 475

原创第七十五周周报

All are Worth Words: A ViT Backbone for Diffusion Models：设计一个通用的基于ViT的架构U-ViT，将时间、条件和噪声图像patch在内的所有输入作为标记，并在浅层和深层之间采用long skip connection。1、根据stylegan2作者的回复，对比了tensorflow版本和ViTGAN的参数，重新修改了stylegan2的参数，目前正在跑。2、根据DViTGAN的随机数种子，重新实验ViTGAN，进行定性实验。

2024-02-24 00:33:23 284