-----文生xx相关学习-----
文章平均质量分 86
主要基于sora的相关探索,扩展自身对于文生文、音频、图、视频相关的技术探索,并测试完成一些相关的小项目
朔漠君
凡是过往皆为序章,所有将来皆为可盼。
展开
-
文生视频相关资源汇总
本次学习及其硬核,从sora的技术报告研读,到大咖交流,然后对sora可能实现路径的猜想交流,和开源资料分享。整体脉络非常清晰,本人只是AI技术的爱好者,主职算法不涉及AIGC的内容,可以说是纯小白,但这段时间的学习,让我基本摸清了文生视频的发展路径,了解到了sora为什么能横空出世,只是在这条路径中自己有太多不了解的地方,需要花时间去昂实相关基础。后续会一点一点补齐相关知识,用一些项目练习,相关文档和代码都会秉承Datawhale的开源理念,分享在CSDN和Github上。原创 2024-03-12 15:19:11 · 411 阅读 · 0 评论 -
扩散模型基础学习
在变分自编码器(VAE)的一年后,生成对抗网络(GAN)出现,其特征是基于两个神经网络的协作来生成:一个生成器和一个鉴别器,涉及对抗训练过程。在文生图任务中,在输入文本信息的同时,还需random函数生成一个高斯噪声矩阵转为latent featrue的替代输入到SD模型的“图像优化块”中。以文生图任务进行讲解,即将一段文本输入到SD模型中,经过一定的迭代次数,SD模型输出一张符合输入文本描述的图片。在GAN发表六年后,去噪扩散概率模型(DDPM)出现,其结合了两模型的优势,擅长于创造多样化和逼真的图像。原创 2024-03-09 10:48:24 · 939 阅读 · 0 评论 -
文生视频基础1:sora技术报告学习
当前比较主要是对于两次直播内容的一些总结和个人想法,后续还需要分步去完成相关的知识积累原创 2024-02-29 14:46:04 · 974 阅读 · 0 评论