- 博客(5)
- 收藏
- 关注
原创 详解MiniGPT-4
MiniGPT-4 是一个高效的多模态模型,它通过整合 BLIP-2 的视觉组件和Vicuna 的语言模型,并在视觉和语言之间加入单层投影层实现对齐。模型采用了冻结策略,仅微调投影层,并通过高质量数据进一步提升对话能力。这使得 MiniGPT-4 能够在较少计算资源的条件下,展现出接近 GPT-4 的视觉对话能力。
2024-10-26 23:10:11
1439
原创 手撕多层感知器MLP——手撕神经网络系列(一)
本系列为手撕神经网络系列,这是本系列的第一篇文章,手撕多层感知器MLP (Multilayer Perceptron)。此 MLP 网络将包括一个输入层、两个隐藏层和一个输出层。
2024-10-25 19:01:35
824
原创 Vision Transformer (ViT) —— 多模态学习笔记(一)
本文详细介绍Vision Transformer,ViT模型的基本原理和技术细节。
2024-10-25 16:45:41
2111
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
6