- 博客(1)
- 问答 (1)
- 收藏
- 关注
原创 Qwen2-VL-7B本地部署和微调
Qwen2-VL-7B 是阿里巴巴开发的一款多模态大语言模型,属于Qwen2-VL系列的一部分。该模型能够处理文本、图像、多张图像和视频输入,尤其擅长视觉-语言任务,如文档理解、视频问答和复杂的多语言任务。它在多个视觉理解基准测试中表现出色,包括DocVQA和MTVQA。Qwen2-VL-7B 拥有约70亿参数,支持多种语言,包括中文、英文、日语、韩语、阿拉伯语等。这使得它适用于跨语言场景,尤其在文档、图片和视频的多模态理解方面具有领先的表现。
2024-09-11 23:38:42 2593 8
空空如也
手机能用的虚拟摄像头
2021-06-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人