这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多!
紧接着,微软祭出的“Phi-3-Mini”以3.8B的小体积,跑出Mixtral 8x7B和GPT-3.5等大模型才有的成绩,似乎在用实力证明,在小模型这件事上,微软才是真正的领先者。让人直呼离谱!
下图能看到Phi-3-Mini并非夸张!通过学术基准和内部测试来看,Phi-3-Mini在MMLU上达到了69(高于Mixtral 8x7B的68.4),在MT-bench上达到了8.38(高于GPT的8.35 )。
图片
这下Phi-3-Mini是一个名副其实的小体积,大性能的模型了。研究人员直接用iPhone进行了测试。
结果:Phi-3-Mini可以在手机上完全离线地本地运行,该模型的小体积使其可以量化到4位,占用仅约1.8GB的内存(比微信小得多)。Phi-3-Mini在iPhone 14上使用A