梦晨 明敏 发自 凹非寺
量子位 | 公众号 QbitAI
果然只有雷军和小米,能抢走风口上大模型的热度。
在雷军的年度演讲分享中,讲武大求学经历,分享学霸4年大学2年完课经验;讲被《硅谷之火》点燃,勤奋练习写最好的代码,开启第一次创业的往事;最后加入金山、创办小米,一路坚持梦想、实现梦想、不断成长的知行合一……
于是雷军超燃演讲刷屏之下,自家大模型前脚刷新的纪录、引发的热议,都被盖过了。
不仅如此,发布会上一系列小米技术的最新进展,也被盖过了——但再回头来看,其实都很重要很值得关注,比如AI大模型装进手机、小爱同学的大模型升级、仿生四足机器人新落地……
以及雷军还亲自公布了小米的科技战略、AI公式,AI即将对小米展开的全方位刷新。
这也是为什么小米的这波AI新进展值得详谈。
我们先从四两拨千斤的小米大模型说起。
AI全面赋能,把大模型塞进手机
小米自研大模型MiLM,在雷军演讲前一日就现身GitHub,也卷也不卷。
不卷在规模,主打6B、1.3B(64亿参数,13亿参数)版本,妥妥的轻量级选手。
卷在了性能,把更小巧的1.3B参数版本塞进手机,做到在很多场景上可以媲美云端大模型效果。
小米大模型团队由栾剑带队,向小米集团技术委员会AI实验室主任王斌博士汇报。从今年4月开始研发,短短4个月时间已经交卷。
成绩如何,先上评测结果:
6B参数版本,在C-EVAL权威榜单上取得同参数量级排名第一,CMMLU中文向大模型取得排名第一。
具体来说,C-EVAL数据集是一个全面的中文基础模型评测数据集,涵盖了52个学科和四个难度的级别。
CMMLU 数据集是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。
自去年11月ChatGPT来袭,最先行动起来的多是云计算公司如微软谷歌亚马逊。
但随着技术进一步成熟,端侧大模型成为行业下一个发力点,苹果方面已有传闻,而小米抢先跑进第一梯队。
把大模型塞到手机里,好处在哪?
首先,本地运行不用担心信号差、飞机无网络等情况,且响应速度更快。
同时,用户隐私更有保障,也便于提供更个性化的服务。
总结一下就是:随时随地享受AI带来的先进生产力。
与此同时,量子位也获得了新版小爱同学邀测资格。
还是那个熟悉的声音,不过在大模型加持下,小爱同学真的可以说进化成智能助手了 。
先按能力推荐,解释一下最近很火的超导概念,不成问题。