大模型LLM的未来发展

以LLM为代表的大模型显然暂时占据了当下AI潮流的鳌头,作为AI的新突破,其实也算属于婴儿期,那么未来会如何发展呢,不妨大胆猜测一下:

       1. 大模型随着更新换代,比如ChatGPT,应该越来越聪明,减少目前的诸多缺陷,比如借助内部的外挂手段,如检索LLM的增强生成Retrieval Augmented generation-RAG等。

       2. 响应速度会越来越快(如GPT-4o,响应速度达到人类级别,200-300毫秒),实时交互体验逐渐变好,加速应用的发展。

       3. 多模态的LLM(文本、图像、视频、音频等),对于物理世界的多通道信息的理解与输出控制,能够使得大模型更加聪明,综合能力更强(想一下,几个瞎子摸象)。

       4. 大模型的外挂时代(APP)即将到来。LLM外挂具有多种形式,小的,如各种基于LLM简单吐字的应用APP,如助理。大的,如各种利用LLM粗糙大脑的进一步精细化,应用具体化,如专业垂直模型、生产服务机器人、自动驾驶、自动系统、专业数字人等。

      5. 大模型个性化及专业化,产生能够应用到个人、教育或企业业务的专用垂直模型(如医疗大模型、科研大模型、物流大模型等)。未来,大模型内也可以包括大脑+小脑(个性化+专业化)的形式,而不仅仅是改变LLM内部参数的方式,或者加外部外挂(小脑)的形式。

      6. 大模型可以越来越小,从而嵌入手机、IOT物联网设备、机器人、无人机、无人船、无人车,可以采用“外脑(云端部署)+本地大脑+本地局部小脑”(如强化学习RL或传统优化控制方法MPC、甚至PID等)从而更加敏捷地控制具身智能的外挂体。

      7. 大模型随着初级的百模大战,会逐步过渡到生态大战,一个可能的结果是:Token免费使用,从而从生态赚钱(互联网的搜索引擎就是一个前例)。

      8. 大模型的算力恐慌未来会被新的计算技术突破,如量子计算的突破,得到缓解,并带来新的突破。

      9. LLM数据恐慌问题,或许通过LLM-Agent对物理世界的社会模拟、自然模拟一定程度缓解,也就是通过Agent在虚拟世界的交互,加上(部署在物理世界的海量基于LLM的智能体)对物理世界的交互与映射,在一个基于LLM-Agent的数字孪生世界,产生机器智能体自身对于物理世界的认识、知识规律的理解,作为LLM基于人类积累的网络形式知识的学习(training)补充,而进一步产生机器自己的新的混合智能。

本文来自罗汉江科学网博客。
链接地址:https://blog.sciencenet.cn/blog-451666-1440853.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值