点击上方关注 “终端研发部”
设为“星标”,和你一起掌握更多数据库知识
又一个国产AI在外网被刷屏了!来感受一下这个feel:
之所以如此火爆,是因为它以仅仅8B的体量,在多模态能力上直接能跟GPT-4o掰手腕!
从分数上来看,仅8B的MiniCPM-o 2.6整体能力已经可以跟GPT-4o比肩,甚至在很多细分项目中实现了超越:
例如MiniCPM-o 2.6可以直接“盲听”声音,就知道你在干什么:
例如你Pad上的MiniCPM-o 2.6,就可以“睁眼”玩儿三仙归洞,还能记住所有牌被翻过去前的图案:
而且是在iPad上就能跑,当你对着iPad喊"用四川话教煮火锅",MiniCPM-o 2.6秒变川菜大师傅,连"花椒要炒到跳舞"的玄学火候都讲得头头是道;对着《黑神话:悟空》片段问游戏名,AI精准报菜名般吐出答案,仿佛在玩"你画我猜"作弊版。视觉方面,MiniCPM-o 2.6展现了超强的实时动态理解能力。官方演示中,它在“三仙归洞”游戏中精确追踪目标位置,甚至在观众提问前已给出正确答案。
面对复杂的记忆卡牌游戏,它能准确记住每张牌的图案和位置,展现出堪比人类的观察与记忆能力。
最绝的是视频理解能力——它能记住你提问前30秒的每一帧画面,连《甄嬛传》里华妃翻的白眼都能精准复盘,堪称"像素级记忆大师"
在说方面,MiniCPM-o 2.6现在更自然了,不仅能扮演新闻主播、学生等各种角色,甚至连咖喱味的英文(印度口音)也能整出来。
当然,实时打断也是不在话下:
4O的能力吊打目前图片生成第一梯队的模型,包括FLUX。
图生图,漫画风格化,一致性非常好,神态一致,女生衣服上的96都没丢。
从众多网友们转发的实测体验来看,效果也是有点意思在身上的。
例如MiniCPM-o 2.6可以直接“盲听”声音,就知道你在干什么 ?一说就跑分牛,但一用有很多人说不好用,比不上外国的
按这个速度,2030年的科技头条可能是:《中国成功将ChatGPT-10塞入智能佛珠,少林方丈现场演示"AI诵经"》。
至于现在?建议赶紧检查家里电子设备——说不定你的扫地机器人正在用MiniCPM-o 2.6偷偷写辞职信,准备跳槽去元宇宙当CEO了。
但是当时国外不开源,国内一片寂静,自从国外开源了,国内一片百花齐放,懂的都懂。。。。