学习时间:2023.11.06-2023.11.11
学习内容:1、看了论文《One Transformer Fits All Distributions in Multi-Modal Diffusion at Scale》
2、尝试跑通代码,目前跑通了文本转换为图片的部分。
3、正在跑图片转文本代码
4、文本图像的联合生成,图片转文本转图片,文本转图片转文本还没开始跑
5、android项目封装计时器类,重写验证码获取接口。
6、学习一个开源项目源代码
t2i: text to image
i2t: image to text
joint: joint generation of text and image
i: only generate image
t: only generate text
i2t2i: image variation, first image to text, then text to image