生成式AI的热度从年初持续至今,大语言模型一时间也成为各大科技厂商的“必争之地”。
其中,百度文心一言在3月16日开启内测,成为全球科技大厂中,第一个发布GPT大模型产品的公司。在不少业内人士眼中,百度文心一言的发布,也是中国AI迈入新阶段的一个重要标志。
那么,大模型究竟会给世界带来怎样的改变?哪些行业会在其助力下实现飞跃发展?从百度来看,又凭什么成为全球科技大厂中,第一个发布大模型产品?
5月26日,在2023中关村论坛上,百度创始人、董事长兼CEO李彦宏发表了《大模型改变世界》的演讲。
这场演讲中,他对上述热点问题一一做出了解答。
在其看来,当下,我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。大模型时代来了,每一个产品都值得重做一遍,百度要成为第一个把全部产品都重做一遍的公司,不是整合,不是接入,是重做,重构。
以下为李彦宏在本次论坛中的演讲精编,希望对你有所启发。
口 述:李彦宏 百度创始人、董事长兼CEO
来 源:正和岛(ID:zhenghedao)
尊敬的各位领导、各位嘉宾,大家好!
很高兴参加2023中关村论坛。中关村论坛是全球科技创新交流合作的国家级平台,我今天分享的话题也聚焦创新,主题是《大模型改变世界》。
最近一段时间,人工智能再次成为人类创新的焦点,越来越多的人认可第四次产业革命正在到来,而这次革命是以人工智能为标志的。
之所以成为焦点,是因为大模型。大模型成功地压缩了人类对于整个世界的认知,让我们看到了实现通用人工智能的路径。
当下,我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。
为什么说大模型改变人工智能?
因为大算力、大模型、大数据,导致了“智能涌现”。什么叫智能涌现?过去的人工智能是,我想让机器学会什么技能,就教它什么技能。教过的有可能会,没教过的就不会。大模型出现“智能涌现”之后,以前没教过的技能,它也会了。
与此同时,人工智能发展方向从辨别式走向生成式。什么叫辨别式?搜索引擎就是典型的辨别式。什么叫生成式?用AI进行文学创作,写报告、绘制海报等等,这些都是生成式。
生成式AI,会让工作效率大幅度提升。有研究机构认为,在未来10年,知识工作者的效率可以提高4倍。
那么大模型怎么重新定义人工智能?
第一,大模型重新定义了人机交互。过去几十年,人机交互方式发生了三次变化:
比如,命令行是我读大学读研究生的时候,主要的工作界面。我输入一个命令,它给我想要的反应。我当时觉得效率很高,但是大多数人不会这种操作。
更简单的人机交互方式是什么?是图形用户界面(GUI)。
就是用鼠标一层一层点击菜单。这种方式比第一个要更友好,起码很多人能看懂,但它仍然不是最自然的交互方式。
人工智能的诞生,让我们可以用自然语言跟电脑进行交互。
比如说,我想查一下“4月份,我的公司有哪些产品的毛利率,超过了疫情前的水平?”这个事,在过去很可能需要我的助理花半天一天时间才能获得。今天,如果计算机懂你的自然语言,一秒钟之内就可以给你一个表格。
自然语言人机交互会带来提示词革命。也就是说,未来的应用,是通过自然语言的提示词来调动原生AI应用实现的。这意味着,未来你的薪酬水平,将取决于你的提示词写得好不好,而不是取决于你的代码写得好不好。
我做过一个预测,10年后,全世界有50%的工作会是提示词工程。提出问题比解决问题更重要。我们的教育要教孩子提出问题,而不仅仅是解决问题。
第二,大模型会重新定义营销和客服。
谁拥有最佳的跟客户沟通的方式,谁就会拥有这个客户。这个道理在大模型出现之前就成立,但有了大模型,即使你有70亿个客户,每一个客户也都可以有一个专属的、7×24小时的、什么都知道的助理去服务他。
第三,大模型会催生AI原生应用。
AI时代的原生应用,到底长啥样?比如,DoNotPay,是一个用AI帮人打官司、写法律文书的应用,AI帮你把不该付的钱要回来。Jasper是一个通过Al帮助企业和个人写营销推广文案的应用。Speak是韩国一个学外语的应用。大模型成为一对一的教师,为每一个孩子提供个性化教育。
百度也在用AI原生思维重构我们所有的产品、服务和工作流程。比如我们的如流智能工作平台,让每一位员工都有一个具有丰富专业知识、实时响应的工作助理。通过对话理解能力,实现聊天记录的智能总结。我的同事评价说,“整个惊呆了”“这个当时确实秀到我了”。
业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!
3月16号,文心一言发布,百度成为全球科技大厂中,第一个发布GPT大模型产品的公司。能这么快发布,是因为长期的积累和投入。早在2019年,我们就发布了文心大模型1.0,此后不断迭代到2.0、3.0,很快,我们还会推出文心大模型3.5版本。
目前市场需求非常旺盛,中国人拥抱新技术的热情前所未有。文心一言也在飞速进步,比如,QPS 每秒查询推理响应速度,提升10倍,这代表着推理成本已经降低为原来的十分之一。
未来,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型,大模型会深度融合到实体经济当中去。
云计算的游戏规则彻底被改变,客户选择云厂商,主要会看它的模型好不好,框架好不好,而不是算力、存储这些传统能力。
大模型改变人工智能的背后,IT技术栈也发生了非常根本的变化。过去,无论是PC还是移动时代, IT技术栈都是三层,芯片层、操作系统层、应用层。
人工智能时代,IT技术栈变成了四层:底层仍然是芯片层,但主流芯片从CPU变成了GPU。百度在芯片层的布局是昆仑芯,已经量产几万片。昆仑芯第三代,预计2024年初量产。
芯片上面叫做框架层,就是深度学习框架。百度的飞桨,Meta的PyTorch,谷歌的TensorFlow都是在框架层。百度的飞桨,在中国的市场份额排第一。
框架上面是模型层,ChatGPT、文心一言都是属于模型层。百度在模型层的布局,除了文心一言,还有交通大模型、能源大模型等行业大模型。
最上面才是应用层,就是我们前面提到的这些AI原生应用。
百度在这四层,都有全栈自研的产品,层层领先,可以实现端到端优化,大幅提升效率。
最后,我想讲一下百度为什么能做到:
一是技术上长期投入和积累。
**二是拥有独特优势。**我们的四层架构,在实际应用中,的确大幅提升了效率。比如我们通过智能调整红绿灯的时间,可以让城市交通效率提升15%到30%。五一长假之前最后一个工作日,北京大堵车,从二环堵到六环一片红,唯一绿的是亦庄,因为亦庄300多个路口全部部署了百度AI信控系统。
**三是自主可控。**文心一言做到了数据可控、框架可控、模型可控,能够体现在国际竞争当中高水平的科技自立自强。它可以赋能千行百业,助力中国经济开创下一个黄金30年。
今天,全球都在关注通用人工智能(AGI)的发展,也引发了一些争议。
大家担心机器会不会取代人?我认为把机器变成人,不应该是努力的方向。机器很多方面会比人强,但机器变不成人,也没必要变成人。机器会越来越聪明,能够干的事越来越多,效率会越来越高,我们需要与机器共生,而不是二元对立。
那么,如何防止失控?人工智能技术飞速发展过程中,确实有可能出现对人类不利的方向。防止失控,需要拥有先进AI技术的国家通力协作,从人类命运共同体的高度来制定规则。
要参与规则的制定,就要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】