Kimi-VL 采用了一种专家混合架构,仅在执行特定任务时激活部分模型。尽管只有2.8亿个活跃参数,但 Kimi-VL 在多个基准测试中表现出与许多大型模型相媲美的结果,其效率远超许多同类产品。
在图像处理方面,Kimi-VL 的能力也相当引人注目。与一些其他系统不同,该模型能够分析完整的屏幕截图或复杂图形,而无需将其拆分成更小的部分。它还可以处理数学图像问题和手写笔记。在一项测试中,Kimi-VL 成功分析了一份手写手稿,识别出与阿尔伯特・爱因斯坦相关的引用,并解释了其重要性。
-
Github开源仓库地址:GitHub - datawhalechina/self-llm: 《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调(全参数/Lora)、部署国内外开源大模型(LLM)/多模态大模型(MLLM)教程
- 【Kimi-VL】模型已经在趋动云『社区项目』上线,无需自己创建环境、下载模型,一键即可快速部署,快来体验【Kimi-VL】带来的精彩体验吧!
项目入口:https://open.virtaicloud.com/web/project/detail/571932504844832768
视频教程:
云平台一键部署【Kimi-VL】 多模态对话助手_哔哩哔哩_bilibili
启动开发环境
进入【Kimi-VL】
项目主页中,点击运行一下
,将项目一键克隆至工作空间,『社区项目』推荐适用的算力规格,可以直接立即运行
,省去个人下载数据、模型和计算算力的大量准备时间。
配置完成,点击进入开发环境
,根据主页项目介绍进行部署。
使用方法:
在gemini/code目录
打开项目介绍.ipynb
,选中安装依赖单元格,点击运行所有单元格。
等待生成端口号,点击端口,添加端口号5000,浏览器打开外部访问链接。
webui使用方法
示例展示:
➫温馨提示: 完成项目后,记得及时关闭开发环境,以免继续产生费用!
智汇全球,趋动未来
『社区项目』汇聚全球智慧,是促进技术交流的宝贵平台,期待每一位AI爱好者体验一键部署功能的强大魅力。
同时,我们也热切盼望每一位码友加入,分享您的精品作品,共筑这个充满活力与创新的技术乐园。