机器学习
文章平均质量分 73
小杰瑞很垃圾
文章仅用作个人学习
展开
-
学习笔记(一)----CLIP
是一种基于对比学习的多模态模型,它的训练数据是 文本-图像对(例如:这是一只狗+狗图)。通过对比学习,让模型学到文本-图像的对应关系。为了训练CLIP,OpenAI从互联网收集了共4个亿的文本-图像对,论文称之为WebImageText。训练完成的CLIP模型可以直接迁移到自己的任何数据集上,完全不需要图像标签微调即可实现zero-shot分类。原创 2024-03-27 20:14:47 · 1049 阅读 · 0 评论 -
学习笔记(二)----diffusion model
(本文介绍的diffusion Model 是论文:Denoising Diffusion Probabilistic Models(DDPM)去噪扩散概率模型,DDPM是2020年提出,是AIGC主流生成模型)我们可以看到最近很火的text-to-image,通过给定文本描述生成图片,当前最先进的两个text-to-image是OpenAI的DALL E2和Google的Imagen,他们都是基于扩散模型来完成的。什么是扩散模型?|Lil'Log的 (lilianweng.github.io)原创 2024-04-01 16:29:28 · 922 阅读 · 0 评论 -
Day2:Alexnet训练自己的数据集--多分类
多分类原创 2022-08-10 10:21:10 · 631 阅读 · 0 评论 -
DAY1:RCNN简介
一、什么是RCNNR-CNN全称是Region-CNN,将候选区+ CNN结合,是第一个成功将深度学习应用到目标检测上的算法,从而提高目标检测效果。二、与传统目标检测区别R-CNN总体遵循传统目标检测流程,区别在于特征提取一步,将传统目标检测特征提取(Harris、SIFT、SURF、LBF)改成卷积神经网络来进行特征提取。三、R-CNN算法流程(一)生成候选区域(二)特征提取(三)类别判断(四)精修位置(一)生成候选框论文主要利用selective sea...原创 2021-07-27 15:20:36 · 907 阅读 · 1 评论