- 博客(166)
- 资源 (6)
- 收藏
- 关注
原创 第一百零八周周报
1、这周按照吉安县的要求重新修改了小程序的代码,由于改动的是系统搭建之初就完成的需求,花的时间比较的。2、CelebA128的FID暂时还不行,比DViTGAN的FID差了1,又重新开始调了。
2024-10-26 01:22:48 234
原创 第一百零七周周报
这周大部分时间都在黄山开会,目前cifar10还没调好,celebA128的fid到了13点多,还没有跑完,其他时间都在找工作。
2024-10-19 02:24:48 221
原创 第一百零五周周报
1、这周实验没什么进展,模型的cifar10还在调参,celeba128还没跑完,celeba64跑出了一个比前面更好一点的值。2、这周完成了PG2024 PPT的撰写。
2024-10-05 01:02:17 279
原创 第一百零一周周报
1.这周把cifar10和celebA跑了一下,cifar10的结果不用ema是由于以前DViTGAN的结果,但是由于保存权重的代码有一行写错了,无法测试FID和IS,所以又重新跑了一下,目前还没有跑完。celebA暂时只跑了22w轮,但是目前的IS已经优于DViTGAN,FID还有一点差距。2.这周把移动进行数据展示的工作完成了。
2024-09-07 02:55:24 221
原创 【无标题】
1、新改的模型FID在40左右,目前正在往两个方向改,一是降低加噪强度,二是改代码。2、移动的新需求目前还没做好,因为数据有点多,数据展示时效性有点高,暂时还没弄好。
2024-08-24 02:15:12 208
原创 第一百周周报
2、论文按照邮件的要求修改好了格式,新开始的实验暂时还没有跑完,因为中间又有两天服务器关了。1、本周将移动的项目部署好了,吉安小程序按照政府的要求新加了功能。
2024-08-17 00:45:04 137
原创 第九十九周周报
这周主要在移动配服务器,由于不太熟悉系统,所以花了很多时间,其他就是在改论文和回复。服务器由于开的节点太少了一直抢不到,所以跑不了模型。
2024-08-10 01:51:51 203
原创 第九十八周周报
这周主要在按照审稿人的意见修改论文,由于有个模型保存的文件找不到了,所以重新训练花了点时间,目前已经把修改后的论文和cover letter发给杨老师了。
2024-08-03 22:31:19 231
原创 第九十七周周报
这周科研暂时没有进展,因为服务器这周都进不去,周一的时候上周跑的节点还被停了(机房太热),然后这周主要在改吉安县小程序的bug,因为要上线了又暴露出比较多以前没有测到的问题。
2024-07-27 00:53:21 256
原创 第九十一周周报
根据给定的ODE,可以将数据平滑的转换为噪声,简单来说就是从原始图像到某个加噪图像,每一个步骤加的噪声都是特定的,一旦轨迹确定了,则对应的加噪图像也会被确定,反之亦然。与Diffusion Model的随机采样不同,Consistency Model 要求训练出来的模型对于一个采样路径上的每个点都保持 consistency,即预测结果保持一致。目前项目已经完成不同格式流到rtsp流的转换,并往旷视的Ai盒子推流,这两天把保存数据的完成就可以完成初步的demo。为了提升图像采样质量,可以使用多步采样。
2024-06-15 01:26:59 253
原创 第八十六周周报
上周由于256分辨率太大的原因没有将stable diffusion和vqgan跑起来,这周将分辨率改到32。同时这周新跑了一个lsun_bedroom64数据集。这周继续润色了一下论文,修改了一些细节并重新画了一下模型结构图。
2024-05-11 01:15:14 241
原创 第八十周周报
实验上,dit的cifar10数据集试了很多参数都没调出来;定性实验由于ViTGAN设置随机种子的代码是错误的(之前没注意到,只是将随机种子改为相同的),所以又改了一下重新跑。另外我注意到ViTGAN和ContraD中的定性实验图像也没有固定随机种子(定性实验对比的图像不一致)。这周主要在改论文,已经改好了中文和英文版本。
2024-03-30 01:28:56 213
原创 第七十八周周报
目前stylegna2、diffusion-stylegan2、U-ViT的实验以及ViTGAN cifar10的定性试验已经完成,还剩CelebA64的定性实验,以及DiT的实验。DiT模型改完后使用cifar10数据集训练测出来的fid为58,is为6.7。由于作者未使用cifar10数据集,只有256和512分辨率的参数,所以正在对其进行调参。
2024-03-15 22:10:09 285
原创 第七十七周周报
diffusion-stylegan2本来已经跑出来结果,并且与DViTGAN一样,加扩散比stylegan2效果好,但是周四结果被我不小心删了,只能又重新跑一份,目前来看可以重新复现出来。UViT已经跑出来结果,fid3.36,由于代码参数不一致,Transformer的参数无法修改成一致的,就只能用原模型跑。DiffT的代码暂时还没改好。
2024-03-09 02:07:34 268
原创 第七十六周周报
仔细看了论文"All are Worth Words: A ViT Backbone for Diffusion Models",”DiffiT: Diffusion Vision Transformers for Image Generation“,“Scalable Diffusion Models with Transformers”。第一个是Contrad中的stylegan2,目前已经跑完,修改好了代码在跑diffusion-gan;都可以单独跑stylegan2。
2024-03-02 00:29:32 438
原创 第七十五周周报
All are Worth Words: A ViT Backbone for Diffusion Models:设计一个通用的基于ViT的架构U-ViT,将时间、条件和噪声图像patch在内的所有输入作为标记,并在浅层和深层之间采用long skip connection。1、根据stylegan2作者的回复,对比了tensorflow版本和ViTGAN的参数,重新修改了stylegan2的参数,目前正在跑。2、根据DViTGAN的随机数种子,重新实验ViTGAN,进行定性实验。
2024-02-24 00:33:23 263
原创 第七十二周周报
2、stylegan和diffusion-stylegan2还是没有进展,新改的代码fid分别维持在28和23,目前联系了仓库的作者,打算向作者请教一下。1、经过不断调参,目前DViTGAN的效果已经比ViTGAN好。
2024-02-03 01:15:25 225
原创 第六十七周周报
3、LSUN64实验结果超出了原模型,但是FID有点高。1、根据杨老师的建议修改了论文,已经发给杨老师看了。根据吉安那边的要求修改了代码,已经完成需求。2、CelebA64实验结果有一个可用。
2023-12-23 01:36:42 479
原创 第六十六周周报
本周根据项目方提出的修改内容,在完善资讯动态、活动风采的代码,剩下的内容预计下周完成。3、固定随机种子的实验由于中途模式崩溃,暂时还没完成。2、本周完善了论文,加上了部分参考文献、模型结果。1、本周大部分时间在写开题报告,已完成。
2023-12-16 01:24:41 438
原创 第五十二周周报
实验由于资源太紧张了这周还是没有跑完,只跑完一个相对位置编码的。完成模型结构图和伪代码,补充论文引用并完善一些小细节。修改了一下扩散的代码,目前来看效果比以前好一些。
2023-09-09 02:10:13 148
原创 第五十一周周报
完成论文基本撰写,剩下实验部分和需要小修的地方,方法部门由于实验还没做完,傅里叶编码的效果暂时不知,所以还没有写上这个方法。由于学校网问题,实验暂时还一个没跑完。
2023-09-02 00:16:24 111
原创 第五十周周报
1、由于前面的实验效果没有超过原模型,因此这周又继续实验相对位置编码。2、在添加位置编码实验的基础上增加diffusion步骤。2、由于理论知识还有些欠缺,扩散部分暂时还没有编写。1、编写了添加位置编码方法的内容。
2023-08-25 23:28:36 151
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人