手撕CLIP -- Day2 -- dataset

小菜鸟博士

已于 2025-04-05 11:25:41 修改

阅读量512

点赞数 15

分类专栏：手撕CLIP 文章标签：深度学习人工智能算法学习

于 2025-02-04 07:00:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62030579/article/details/145430581

版权

手撕CLIP 专栏收录该内容

5 篇文章

订阅专栏

手撕CLIP – Day2 – dataset

目录

手撕CLIP -- Day2 -- dataset
Contrastive Language-Image Pre-Training (CLIP) 模型原理

Contrastive Language-Image Pre-Training (CLIP) 模型原理

CLIP 网络结构图

在这里插入图片描述

CLIP 网络结构

Dataset代码 - 利用Mnist数据集做分类

Dataset代码

Part1 库函数

# 该模块主要为了实现CLIP的Mnist数据集的实现
'''
# Part1 引入相关的库函数
'''
import torch
from torch.utils import data
import torchvision
from torchvision import transforms

Part2 初始化一个数据集的类

'''
# Part2 实现数据的预处理和数据集的下载
'''

transform_action=transforms.Compose([
    transforms.ToTensor() # 从Pillow到Tensor，除了255，变换了通道的顺序(img_size,img_size,channel)->(channel,img_size,img_size)
])

Mnist_dataset=torchvision.datasets.MNIST(root='Mnist_dataset',train=True,transform=transform_action,download=True)

Part3 测试

'''
# Part3 测试
'''

if __name__ == '__main__':
    import matplotlib.pyplot as plt

    ds = Mnist_dataset
    img, label = ds[0]
    print(label)
    plt.imshow(img.permute(1, 2, 0))
    plt.show()

参考

视频讲解：【多模态】复现OpenAI的CLIP模型_哔哩哔哩_bilibili

模型原理讲解：手撕CLIP – Day1 – 基础原理-CSDN博客

github资料：YanxinTong/CLIP_Pytorch: 利用 Pytorch 手撕 CLIP 模型

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。