【多模态大模型实战】搭建DeepSeek Janus-Pro 7B 多模态模型，以及推理微调，推理后的模型融合

AI智韵

已于 2025-02-07 15:22:00 修改

阅读量2.4k

点赞数 9

分类专栏：大模型论文翻译与实战文章标签：语言模型人工智能自然语言处理深度学习

于 2025-02-07 15:20:59 首次发布

不能复制，转发

本文链接：https://blog.csdn.net/m0_47867638/article/details/145495913

版权

大模型论文翻译与实战专栏收录该内容

25 篇文章 ¥19.90 ¥99.00

订阅专栏

模型信息

Janus-Pro是DeepSeek最新开源的多模态模型，是一种新颖的自回归框架，统一了多模态理解和生成。通过将视觉编码解耦为独立的路径，同时仍然使用单一的、统一的变压器架构进行处理，该框架解决了先前方法的局限性。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突，还增强了框架的灵活性。Janus-Pro 超过了以前的统一模型，并且匹配或超过了特定任务模型的性能。

代码链接：https://github.com/deepseek-ai/Janus
模型链接：https://modelscope.cn/collections/Janus-Pro-0f5e48f6b96047
体验页面：https://modelscope.cn/studios/AI-ModelScope/Janus-Pro-7B
技术报告：https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf

在这里插入图片描述

安装虚拟环境

建议大家新建

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI智韵 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。