如果2023年是ChatGPT引爆了大语言模型的热潮,2024年,Tesla入局人形机器人和黄仁勋的“AI的下一个浪潮是具身智能”,掀起了具身智能与人形机器人的科技革命;那2025年,春晚宇树机器人和DeepSeek的横空刷屏,则彻底点燃了AI与具身智能的产业。
就在3月5日召开的,今年政府工作报告中,具身智能首次出现,与量子科技、6G 等一同列为未来产业。要培育壮大新兴产业、未来产业,深入推进战略性新兴产业融合集群发展。此消息一出,这对于具身智能,无疑是官宣的重磅炸弹。
而此前2天的3月3号,深圳首发,打造人工智能先锋城市,印发《深圳市具身智能机器人技术创新与产业发展行动计划(2025-2027年)》。培育人工智能与机器人融合技术、多模态感知技术、高精度运动控制技术、灵巧操作技术等方面取得突破。实现十亿级应用场景落地 50 个以上,具身智能机器人产业集群相关企业超过 1200 家。
如此多利好,让我们今天不得不好好梳理一下具身智能。下文从基础知识扫盲、历史溯源、市场规模和现状、上下游产业链和对应龙头标的、总结和展望等五个维度,全面解析这一未来新兴产业。
一、基础知识扫盲
1、什么是具身智能 EAI
具身智能,英文Embodied AI,简称EAI, 依靠物理实体(如机器人、自动驾驶车辆等)与环境交互来实现智能增长的智能系统。在智能体与环境的交互过程中,通过感知、控制和自主学习来积累知识和技能,形成智能并影响物理世界的能力。
其核心在于将感知、决策和执行紧密结合,主要挑战在于硬件性能、算法泛化能力与系统集成水平。
2、易混概念比较
(1) EAI****≠ 大模型+机器人,而是=AI+机器人(等物理实体)。大模型虽有推理决策、语言和视觉能力,但不存在主观感觉能力,多少亿参数都不行。*(观点出自斯坦福教授李飞飞),*脑、身体和环境的深度耦合是产生高级认知的基础。这需要构建新一代人工智能算法,结合了脑神经、运控控制等复杂理论,推动具身智能实现认知涌现。
(2) EAI ≠ 人形机器人, EAI> 人形机器人,具身智能可以搭载到其他机器人,比如仿生机器人、机器狗、L4自动驾驶等;人形机器人只是具身智能的一种应用,也被认为是最理想的应用形态。
(3) EAI ≠ 智能体Agent,两者各有交叉和侧重。 Agent 是代理人,既可以是虚拟世界的,如manus , 也可以是物理世界的智能机器人,;而EAI一定要是真实世界的实体物体,如人形机器人。
3、具身智能三要素
具身智能要同时需要具备**“ 本体 + 环境交互 + 智能进化 ”**三要素:
首先强调要有具身本体,不能是虚拟的,要是实体,可以是人形机器人、四足机器狗、无人汽车、无人飞机等。本体要具备环境感知、运动和操作执行等能力
其次强调与环境的交互能力,不仅能感知环境,还能通过行动来影响环境并在与环境的交互中不断学习和适应。用拟人化的思维路径去学习,做出人类期待的行为反馈。
最后强调一个增量,主要是智能的提升和进化,具身智能不仅仅要利用大模型的知识、算法理解和表达能力,更要通过本体与物理世界的交互来展现和发展智能,实现自主和智能的提升。
4、EAI三大构成部分
具身智能EAI包括感知模块、交互模块、运控模块。其中,感知模块是基础,通为交互与运控模块提供信息,并实时反馈,以便机器人感知外部环境和物体、调整运控规划。
二、历史溯源
具身智能的发展历史可以分为以下四个阶段:
1、早期萌芽阶段(1950s-1990s):1950年,艾伦·图灵Alan Turing在论文《计算机器与智能》中首次提出“具身智能”的概念。1986年,罗德尼·布鲁克斯从控制论角度强调智能是具身化和情境化的。1991年,布鲁克斯在论文中探讨了智能产生的本源,认为智能行为可从自主机器与其环境的简单物理交互中产生。1999年,罗尔夫·普费弗等人提出智能并不局限于大脑或某些算法,强调身体对智能形成的根本影响。
2、 技术积累阶段(1990s-2006):随着智能理论的完善、底层数学理论的深耕,AI三大学派从各自突破,逐步走向取长补短的综合性研究,为具身智能发展奠定理论和算法基础。
3、深度学习推动其快速发展(2006-2020**)**:深度学习的概念由杰弗里·辛顿等人在2006年提出。通过构建深层神经网络,利用其多层结构自动学习数据的层次化特征表示,从而提高模型的性能和泛化能力,这一概念开启了深度学习的新时代。深度学习等技术的快速发展推动了具身智能研究进入新阶段,研究人员开始利用虚拟物理环境和计算能力设计和训练智能系统
4、技术突破阶段(2022年至今):以ChatGPT为代表的大模型的通用知识和智能涌现能力,为机器人实现智能感知、自主决策乃至拟人化交互方面带来巨大潜力。2023年,英伟达创始人黄仁勋提出具身智能是人工智能的下一个浪潮。2024年,具身智能入选“新一代信息工程科技新质生产力技术备选清单”。2025年,具身智能被写入政府工作报告,国内已有超过20个城市将发展具身智能。
从历史的角度来看,工业机器人的硬件进化不断发展,从自动化设备到移动机器人,从协作机器人到人形机器人,每一步都代表着技术的进步和创新。当下,已经进入了AI大模型与机器人在底层技术创新和应用融合的交叉时代。
三、市场规模和现状
1、全球市场:
据机构预测,2025年全球具身智能市场规模将突破千亿美元,其中物流、医疗等垂类场景的渗透率有望达到15%-20%。据高盛研究,人形机器人市场逐年增长,到2035年估值可能高达380亿美元。花旗银行预测,到2050年,全球具身智能/人形机器人数量将超过6亿台,市场规模将达到7万亿美元,未来几年年复合增长率CAGR为47.7%。
2、 中国市场:
据头豹报告显示,2023年中国具身智能市场规模已经达到4186亿元,2027年市场规模有望达到6328亿元,年均复合增长率达10.5%。中国机器人产业稳居全球机器人生产和消费国龙头地位,“十五五”时期,产业规模预计将增长至4000亿元左右,且市场规模稳居全球首位。
3、 国内外具身智能企业
国外有:有特斯拉、谷歌、英伟达等科技巨头,以及Figure、Agility、波士顿动力、1X、NEURA Robotics、Mentee Robotics等初创公司。
国内:具身智能浪潮的玩家主要包括科技大厂、传统机器人公司和新生代的具身智能公司等。这些企业正与最前沿术研究与产品研发相结合,为具身智能市场释放无限想象力
包括华为、比亚迪、腾讯、小米、宇树科技、智元、优必选、新松、大象、科大讯飞等企业。具体看下图:
四、产业链&国内外标的
具身智能EAI通过物理实体(如机器人、自动驾驶车辆等)与环境进行交互的智能系统,融合了先进技术、复杂系统集成和多元化应用场景的综合性产业,其核心在于将感知、决策和执行紧密结合。
EAI的产业链包含上游的芯片、传感器、控制器、电机、通信模组、能源管理等核心硬件和基础材料;中游包括AI算法、大模型、操作系统、云服务等软件和集成平台;下游为主要产品和应用场景。下面来具体拆解一下:
具身智能产业图谱 (图片来自36氪)
(一)、 上游:核心硬件与原材料–基础
上游环节是具身智能产业的硬件基础,主要包括芯片、传感器、控制器、电机(含伺服电机)、通信模组、能源管理等。各硬件拆解如下:
1、 芯片–EAI的“心脏”
目前机器人的“大脑”主要采用AI芯片,包括GPU、TPU、NPU等,主要提供强大的计算能力,支持复杂的算法运行,用于高效处理感知和决策任务。
海外头部厂商,如英伟达、AMD等处于领先地位;国内华为、寒武纪慢慢崛起:华为的昇腾910芯片基于7nm增强版工艺,最大功耗为350W,算力可达到256TFOPS;地平线的征程系列芯片已在多家车企实现量产应用。同时,寒武纪的云端AI芯片、黑芝麻的智能座舱芯片等亦表现不俗。此外,亿铸科技、知存科技、苹芯科技、九天睿芯等一批初创公司选择跳脱传统架构,布局存算一体架构等新兴技术,力图填补国内市场空白。
2、 传感器–收集外界信息
传感器则负责收集外部环境的多维数据,如视觉、听觉、触觉、力矩等,是实现具身智能感知和交互功能的基础。
从技术壁垒、价值量、未来产业趋势,我们认为传感器排序:六维力矩>触觉传感>关节传感>双目摄像头>IMU
(1)力传感器:
能够测量智能体与环境的接触力和力矩,分为一维、三维、六维力矩传感器;其中是六维力传感器技术,需要测量空间三个坐标轴方向的力(F、FY、FZ)和绕三个坐标轴方向的力矩(MX、MY、MZ)的6个维度的力,高精度解耦各个方向和力矩间的干扰,获得力矩的姿态,监测力矩是否在 安全范围内,难度和壁垒极高。
海外六维力矩老牌厂商多,产品精度高,高如韩国的Robotous,采用容式方案,规模较大;美国ATI、AMTI采用应变片式,性能领先,价格高昂;德国的HBM、ME,均可自产应变片;瑞士Kistler是电压式的领导者。国内多家厂商,如柯力传感、安培龙、东华测试等均已开始布局。
(2)触觉传感器:
触觉传感器追求高灵敏度(多维力感知)、高集成度(单位面积列阵单元多)、高延展性(耐用、高分辨率柔性材料)、成本低,以便获取物体信息,提升灵巧手抓取的力和力矩的控制效果,对硬件、生产工艺、算法均要求高。
目前多技术路线并行,短期看,压阻式传感器技术难度低、成本可控,更多在中低端领域放量;而电容式及电磁式性能更优,抗干扰能力提升后,放量潜力大;触触觉传感器理论上限高,随数据积累及大模型成熟,同时集成度提升后,未来潜力大。格局上,美企领先,但中国企业加速布局,未来可期.
(3)机器视觉:
可分为 2D 和 3D 视觉,2D 成像技术使用到的传统 RGB 相机,仅能捕捉到物体表面的纹理信息,没有物体到相机的距离信息,3D 视觉感知可补充 2D视觉的不足。3D 视觉感知技术包括飞行时间(ToF)法、双目立体视觉法、结构光法等。
目前人形机器人主流是 3D 视觉方案为主,搭配激光雷达等多融合方案为辅,以保证具身智能的环境感知及交互能力。
(4)IMU惯性传感器:
能够测量物体的角速度和加速度,主要负责姿态控制和定位导航。利用加速度计和陀螺仪需精确对齐,以避免轴偏角误差要精准测量,做到零偏误差、非正交误差非常难。同事校准算法的开发也非常关键。早期国外Honeywell、ADI卡着技术,现在芯动联科、华艺科技等多家国内厂商都在加速开发。
3、 控制器
是具身智能机器人的“智慧大脑”,对传感器收集的数据进行高效处理,并发出精确的控制指令,传感器反馈信息,指导执行机构完成相应的任务动作。控制器的功能强大而多样,涵盖运动控制、逻辑运算、任务规划等多个方面。
控制器主要是运动控制比如路径规划、强化学习等,可以对传感器采集到的数据进行分析和判断,从而做出相应的决策。例如让机器人在遇到障碍物时自动绕行;在任务规划方面,控制器能够根据任务要求,制定合理的执行步骤和策略,指挥机器人高效完成任务。
4、电机
电机是将电能转化为机械能的关键部件,主要用于产生驱动转矩。驱动各种执行机构的运动。而伺服电机是EAI的核心部件,根据控制器指令实现对运动的精确控制,完成精准定位和操作。其中、无框力矩电机和空心杯电机分别用于机器人的灵巧手,两者壁垒较高:
无框力矩电机:电机结构紧凑,没有轴、轴承、外壳、反馈或端盖;仅由定子和转子组成,高径长比,多磁极设计,是一种特殊类型的永磁无刷同步电机,具备质量轻、体积小、集成度高、响应快、能效高等优势,适合扭矩需求大的的场景,比如机器人的线性关节和旋转关节。
空心杯电机:主要运用于人形机器人的灵巧手,无刷空心杯电机转子由环形磁钢、转轴及其固定件组成,定子由环形硅钢片和空心杯线圈粘结而成。核心工艺为线圈的设计和线圈绕制、自动化设备等3大壁垒。
5、 通信模组
通信模组是将多个功能组件,包括芯片、天线、射频电路等集成在一起,形成一个独立的、可插拔的模块化组件。负责设备之间的数据传输和通信,确保系统各部分之间的协同工作,实现信息的无缝流转。
通过这些模组,不同设备可以在4G、5G、WiFi、BLE或其他通信网络中进行数据交换。如果没有模组,终端就如一座“孤岛”,无法上报数据和接收指令。常用通信模组分类如下:
6、能源管理
整个系统提供稳定的能源供应,包括高性能电池、先进的电源管理系统、能量分配、热管理等系统,确保机器人能够长时间工作、散热和运行和控制的稳定。
7、国内外龙头企业
(1) 芯片与计算平台
国外:NVIDIA(Orin芯片)、Intel(Mobileye)、Tesla(Dojo芯片)。
国内:地平线(征程系列)、寒武纪(思元系列)、华为(昇腾系列)、紫光国微(国产嵌入式AI芯片,融合量子加密技术)。
(2) 传感器:
国外:Velodyne(激光雷达)、Tactile Labs(触觉传感器)。
国内:
①视觉传感器:禾赛科技(激光雷达)、奥比中光(3D视觉)、韦尔股份(CIS图像传感器)、奥普特(3D视觉传感器)、凌云光(可配置视觉系统、智能视觉装备)、水晶光电(滤光片等光学元器件龙头)。
②六维力矩传感:柯力传感、东华测试、安倍龙、纳芯微、凌云股份等。
③触觉传感器:华培动力、安倍龙、康斯特、汉威科技、士兰微等。
④ 温度传感器:安培龙、汉威科技、华培动力等。
⑤ IMU传感:明皜传感(苏州固锝)、芯动联科、华依科技、矽睿科技、深迪半导体、士兰微、美泰科技、星网宇达、理工导航等。
(3)控制器:
汇川技术(运动控制)、瑞德智能、雷赛智能、贝仕达克、和而泰等。
(4)电机:
国外厂商:科尔摩根、TQ Robodrive、Nidec、Parker等。
国内龙头:鸣志电器:(国内第一、全球第四的步进电机龙头)、步科股份(第三代无框力矩电机产品对标国际领先)、兆威机电、伟创电气、禾川科技、合泰科技、大族电机、昊志机电、汇川技术(**国内工业伺服系统龙头)**等。
(5)通信模组:
国内龙头:FiOOCON广和通、日海智能Sunsea AIOT、 NeoWay有方、龙尚科技LONGUNG、ZTE中兴等。
(6)能源管理:
国外:松下Panasonic、LG化学等。
国内:宁德时代、比亚迪、德赛电池(机器人能源管理一体化方案)、中熔电气(国内唯一覆盖1000V机器人高压平台的熔断器供应商)、三花智控(液冷技术机器人热管理)等。
总之、上游环节是整个产业链的基础,为中游和下游提供了必要的硬件支撑。这些基础设施的质量、性能和可靠性直接影响到中游产品的整体性能和下游应用的实际效果。
(二)、中游:系统集成与解决方案
中游环节是产业链的技术核心,涉及AI算法、大模型、操作系统、云服务以及中间件的开发与集成。这一环节的工作是将上游的硬件组件“激活”,通过编程和系统集成,使其能够执行复杂的智能任务。
1、AI算法(大模型)
AI算法是具身智能的“大脑”,负责处理和分析数据,做出决策。
大模型的引入,极大地提升了具身智能的感知精度、决策效率和执行自主性,使其能够更灵活地适应复杂多变的环境,推动智能技术迈向新高度。
我们先看一下大模型的分类,大模型分为具身智能大模型和非具身智能大模型:非具身大模型即传统的语音图文视频大模型,如GPT4或豆包等;具身智能大模型则分为自动驾驶大模型(如特斯拉的FSD、华为乾崑ADS3.0)和机器人大模型(如Figure AI 的Helix,智元机器人的 GO-1等)。
目前,具身大模型可以分为端到端大模型,和分层具身大模型。
从人体“大脑-小脑-肢体”的架构来看,分层大模型通过不同层次模型协作,利用底层硬件层和中间响应快的小模型弥补上层大语言模型的不足,推动机器人在实际场景的应用,曾经是主流。
但随着人工智能的发展,VLA(视觉-语言-动作)等端到端模型能够直接实现从人类指令到机械臂执行,即输入图像及文本指令,输出夹爪末端动作,需要数据的不断积累和技术的迭代。未来端到端大模型是具身智能的主流。
端到端大模型的4种发展路线是:①LLM(大语言模型)+VFM(视觉基础模型→ ② VLM(视觉-语言模型)→③VLA(视觉-语言-动作模型,如谷歌RT-H模型)→④多模态大模型(是未来!如IBM研究的MultiPLY模型)。
下图为具身智能发展阶段:从模块化走向One Model端到端(图片来源甲子光年)
2、操作系统
为智能设备提供统一的软件平台,支持各种应用程序的运行和管理。
3、云平台服务
具身智能,需要处理大量的数据和运行复杂的算法。云服务基于云计算技术,能够提供弹性可扩展的计算资源,满足具身智能在处理大规模数据和运行高性能算法时的需求。
从整体来看,受生成式AI和大模型所带动的算力需求刺激下,云计算市场规模预计将保持长期稳定的增长态势,据中国信通院数据,2023年我国云计算市场规模6165亿元,2027年有望突破2.1万亿元。
国外EAI的云服务平台有亚马逊的AWS RoboMake、微软的 Azure、英伟达的 Omniverse;国内阿里云、天翼云、移动云、华为云、腾讯云以及联通云稳居中国公有云IaaS市场份额的前六名,是具身智能产业发展的有力保障。
4、中游各标的龙头
(1)AI算法(大模型)
①寒武纪:深耕AI芯片设计,思元系列芯片适配具身智能的端侧推理需求。公司与智元机器人合作。
②海光信息:国产AI芯片领军企业,DCU产品性能对标英伟达A100。
③大模型:
通用大模型:国内公布的大模型数量已超过300个,盘古大模型:百度文心一言、阿里云通义、腾讯混元、字节的云雀大模型,科大讯飞的星火大模型、商汤的SenseChat大模型、智谱清言GLM-4等AI通用类大模型。
*机器人大模型*:国外:Figure AI 的Helix大模型(国外)、谷歌 的DeepMind等。国内:智元GO-1 (智元启元大模型,未上市)、星动纪元ERA-42(端到端原生机器人大模型,未上市)、银河通用GraspVLA(端到端具身抓取基础大模型GraspVLA,未上市)等。
垂类自动驾驶大模型:比亚迪璇玑大模型、小鹏的X-GPT大模型、毫末智行的DriveGPT、Apollo ADFM等。
(2)操作系统:
中科创达:全球领先的智能操作系统龙头,专注于为智能终端、智能网联汽车、智能物联网等。
云从科技:深耕人机协同操作系统领域。
华如科技:主营是军事仿真,细分专注于AI训练仿真沙盒系统。
(3)云服务
①百度智能云(Baidu AI Cloud),结合Apollo自动驾驶平台和PaddlePaddle深度学习框架,应用与自动驾驶、配送机器人等场景。
②阿里云ET工业大脑 :聚焦工业场景,提供机器人调度与生产优化服务。
③华为云ModelArts :端云协同AI开发平台,支持昇腾芯片加速推理。
应用于安防机器人、智能巡检等场景。
④ 腾讯云TI-ONE :自动驾驶仿真、AI训练任务编排、分布式加速。
应用于智能交通、无人机路径规划等场景。
⑤京东物流云:多AGV协同、仓库数字孪生、订单智能分拣。
⑥大疆智云:无人机专属云服务平台,支持飞行数据管理与任务规划。
⑦小鹏汽车XCloud:面向车端智能的云平台,支持数据闭环与OTA升级。
⑧商汤科技SenseParrots:3D物体识别、行为预测、多摄像头融合。应用于服务机器人、智能安防等场景。
中游环节是整个产业链的技术核心,不仅负责实现智能设备的各项功能,还为下游应用提供技术支持和解决方案,推动整个产业链的创新和发展。
(三)下游:应用场景
1、应用场景介绍
具身智能在工业制造、服务业、医疗康复、交通出行、应急救援、科研太空探索等领域的多元化应用场景均有广泛应用:
工业制造: 仓储物流AGV/AMR应用、灵巧手在精密组装、检验,特别是在3C、医疗设备和精密仪器的生产线上,进行高精度的组装和调整。
医疗保健: 手术机器人的精确度和稳定性;灵巧手可辅助患者进行物理治疗和功能恢复,通过模仿人类的抓握和释放动作。
服务行业:在酒店、餐厅和零售业,灵巧手可以递送食物、整理商品和提供客服等。人形服务员可以使用灵巧手来处理菜单、账单等。
家庭助理:家庭服务机器人配备灵巧手,可以协助家务活动,如清洁、烹饪、洗衣和照顾小孩或老人、如修理小物件或植物浇水。
科研太空等探索:灵巧手在实验室中用于进行精确的实验操作,减少人为误差。在太空探索和深海研究中,还能够进行样本采集和设备维护。
应急响应:在灾难救援中,灵巧手能够帮助机器人进行搜索、救援和重建工作,处理危险或不稳定的环境。
自动驾驶:L4/L5级无人驾驶车辆、无人配送车等。
整体趋势:从专用到通用,从ToB到ToC,具身智能机器人应用场景持续拓宽。EAI的应用场景先从工业制造业导入,向商业和交通出行到家庭服务消费场景逐步渗透,远期有望应用于外太空航天等极限环境作业。
如下图:
2、国内外龙头
①人形机器人:国外:特斯拉、波士顿动力、Figure AI等;国内: 优必选、宇树、傅利叶、智元、银河通用等。
②自动驾驶: 国外:Waymo、Cruise(L4自动驾驶)。 国内:比亚迪、小鹏、赛力斯、小米、百度Apollo、文远知行等。
③工业领域:国外:KUKA(工业机器人)、Amazon(仓储机器人Kiva)。 国内:埃斯顿(工业机器人龙头)、极智嘉geek+(物流机器人)。 拓维信息(AI+工业机器人,与华为昇腾合作)。
④商业消费领域: 国外:iRobot(扫地机器人)、SoftBank(Pepper服务机器人)。 国内:科沃斯、云鲸(家庭机器人)、云迹科技(商用服务机器人行业领跑者,专注AI、具身智能研发)。
⑤ 医疗领域: 国外:Intuitive Surgical(达芬奇手术机器人)。 国内:微创机器人(腔镜手术机器人)。
五、总结与展望
总体来说,具身智能正迅速发展成为与各行各业深度融合的创新驱动力,其相关应用正快速扩展至社会经济的各个层面,代表的新质生产力的跃升和生活方式的变革。
具身智能被誉为是实现通用人工智能的重要路径。同时,具身智能在感知与认知、学习与泛化、计算能力、多任务处理等多个方面面临着挑战:
其一,算法层面,系统需要人类智能的介入:现在的具身智能研究大多是将大模型的智能塞进机器人中,这仍是学习人类知识和经验的过程,缺乏自主产生意图的能力,也难以快速适应环境变化。
其二、数据层面上,缺乏真实场景的数据和收集成本过高。与大型所依赖的互联网数据不同,EAI所依赖的数据涉及动态环境中的复杂交互,这使得收集数据成为一项昂贵且具有挑战性的工作。
其三、产业链条上,上中游产业的完整性,各组件零部件的精度调试、稳定性、计算能力和各环节之间的协同效率,是具身智能降本增效的关键。下游应用由于面临着场景差异化和开放度挑战,需要在产品开发端考虑产品形态的合理性、内部软硬系统的紧密耦合,提高其通用泛化能力。
未来,具身智能EAI将发展更高级的跨模态交互能力,整合视觉、听觉、触觉等多种感官信息。这种能力意味着具身智能将可以更全面地感知环境并快速适应变化,以及通过多种方式与人类自然交互。
同时,EAI将具备更强的自适应学习能力,能够根据经验自我进化,以便更好地完成任务,具有更强的自主性,最终将演化与人类的协作能力,成为人们工作生活和家庭中的得力助手。
而“世界模型”,被认为是实现通用人工智能(AGI)的重要环节。
人来的终极目标是构建一个统一的模型能够复制基本的世界动态,这不仅能带来机器人训练成本的大幅下降,最主要的是对于EAI,世界模型能辅助具身大模型,以新的场景、新的视角继续迭代新的数据来训练,完成训练仿真测试的真正闭环。
我们正躬身入局,拥抱这天的到来。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。