深度学习
文章平均质量分 60
小杰瑞很垃圾
文章仅用作个人学习
展开
-
学习笔记(一)----CLIP
是一种基于对比学习的多模态模型,它的训练数据是 文本-图像对(例如:这是一只狗+狗图)。通过对比学习,让模型学到文本-图像的对应关系。为了训练CLIP,OpenAI从互联网收集了共4个亿的文本-图像对,论文称之为WebImageText。训练完成的CLIP模型可以直接迁移到自己的任何数据集上,完全不需要图像标签微调即可实现zero-shot分类。原创 2024-03-27 20:14:47 · 954 阅读 · 0 评论 -
学习笔记(二)----diffusion model
(本文介绍的diffusion Model 是论文:Denoising Diffusion Probabilistic Models(DDPM)去噪扩散概率模型,DDPM是2020年提出,是AIGC主流生成模型)我们可以看到最近很火的text-to-image,通过给定文本描述生成图片,当前最先进的两个text-to-image是OpenAI的DALL E2和Google的Imagen,他们都是基于扩散模型来完成的。什么是扩散模型?|Lil'Log的 (lilianweng.github.io)原创 2024-04-01 16:29:28 · 862 阅读 · 0 评论 -
pycocotools怎样在windows安装
什么都不需要直接成功。原创 2023-01-09 23:12:56 · 159 阅读 · 0 评论 -
Day2:Alexnet训练自己的数据集--多分类
多分类原创 2022-08-10 10:21:10 · 588 阅读 · 0 评论 -
【无标题】New1:利用Alexnet训练自己的数据集
基于Alexnet训练自己数据集原创 2022-08-01 21:49:13 · 280 阅读 · 0 评论