多模态大模型1、概览与前置任务

O_meGa

于 2025-06-05 14:31:31 发布

阅读量344

点赞数 6

文章标签： VLM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_34461199/article/details/148450215

版权

1、tokenizer原理与算法

tokenizer原理与算法:BPE，ByteBPE, wordpiece,unilm,sentence-piece
tokenizer训练：sentence-piece

https://blog.csdn.net/fj1024/article/details/139737169 大语言模型之十 SentencePiece-CSDN博客

2、position encoding方案

https://zhuanlan.zhihu.com/p/654277808 大模型中的位置编码ALiBi,RoPE的总结和实现_alibi位置编码-CSDN博客

3、注意力机制与transformer架构

典型的transformer架构

decoder-only
encoder-only
encoder-decoder

Transformer 大模型详解——transformer模型_transformer大模型-CSDN博客

博客等级

码龄9年

92
原创

998
点赞

905
收藏

1980
粉丝

关注

私信

分类专栏

大模型报错 1篇
大模型 2篇
百错千方 3篇
python 37篇
pandas 1篇
numpy 18篇
AIGC论文笔记 9篇
深度学习 9篇
Linux 7篇
小知识 4篇
图像处理 5篇
git 2篇
python千招百式 22篇
pytorch 2篇
AIGC 3篇
GPT系列 2篇
抠图 2篇
AIGC有问必答 3篇

展开全部收起

上一篇：: 知乎好文汇总

下一篇：: 多模态大模型2、大模型训练

最新评论

LLM推理需要占用多少显存
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
5、MAE:探索视觉预训练模型
2401_84641579: 撤回我的评论。失礼了
5、MAE:探索视觉预训练模型
2401_84641579: 文章有一小节单独写了，autencoder和self-supervised learning是不一样的思路。MAE不是自监督学习。
np.repeat用法
November丶Chopin: 写的很好，受教了
1.random模块
LaoYuanPython: 博主辛苦了！欢迎博主到本人的Python专栏来交流！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。