一段话总结
全球AI领域呈现技术爆发与产业落地双线提速态势:智谱GLM-4.6V、美团LongCat-Image等多模态/图像模型开源落地,英伟达NVARC等小模型实现成本与性能突破,CUDA 13.1革新GPU编程降低门槛;AI代理与物理AI深度渗透,豆包手机助手、阿里Live Avatar数字人、工业/医疗/农业垂直模型落地,机器人在深海搜寻、家居组装等场景广泛应用;企业动态频繁,谷歌与Replit深化合作、Meta收购Limitless,投融资聚焦节能AI芯片与通用机器人模型;同时诗歌提示越狱等安全风险与特朗普AI监管行政令同步引发关注,行业在技术迭代、生态竞争、人机协同与安全治理的平衡中加速前行,深刻影响就业结构与产业格局。

思维导向图
一、AI大模型动态
开源模型
阿里:Live Avatar(实时虚拟人)、Qwen3-TTS(多语言语音)、Ovis-Image(文本渲染)
智谱:GLM-4.6V(多模态,视觉+工具调用)
美团:LongCat-Image(图像生成/编辑,中文优化)
微软:VibeVoice-Realtime-0.5B(实时TTS)
英伟达:NVARC(4B参数,ARC-AGI2夺冠,成本1/36)
其他:MiniMax-M2、RNJ-1、NewBie-image(动漫生成)
闭源模型
OpenAI:GPT-5.2(即将发布)、ChatGPT(周活8亿,暂停购物推荐)、Confessions(作弊坦白技术)
谷歌:Gemini 3(Pro/Deep Think)、Titans架构(200万token)、Doppl(AI试穿)
腾讯:混元2.0(406B参数,256K上下文)
苹果:STARFlow-V(视频生成,归一化流技术)
亚马逊:Nova 2系列(Sonic/Forge)
其他:Claude 4.5(Agent能力)、AnuNeko(米哈游旗下)
技术突破
架构创新:CUDA 13.1(Tile编程模型,Python写GPU内核)、MoE架构、交错窗口设计
优化方向:零预训练、测试时微调(TTFT)、长文本稳定性(10000秒+生成)
能力升级:多模态融合、工具调用、中文渲染、低延迟(300ms首音)
二、机器人技术动态
政策支持
美国白宫:2026行政令,税收减免+联邦资金,机器人工作组
产品发布
人形机器人:美的美罗U(六臂)、众擎T800(量产,18万)、Unitree H2、百度“航星一号”
四足机器人:普渡PUDU D5(275TOPS算力)、RIVR(联合无人车送餐)
特殊机器人:龙虾壳生物混合机器人(EPFL)、日本洗澡机器人(Science公司)
移动机器人:现代MobED(量产,物流配送)、Waymo Robotaxi(软件召回)
应用场景
深海搜寻:Ocean Infinity机器人(MH370重启搜寻)
农业:优必选Walker S(垂直农场)、农耕大模型1.0(耕地监测)
工业:隧道湿喷机械手(中铁六局)、美罗U(洗衣机工厂)
服务:交通指挥、酒店前台、智能客服
赛事:ATEC科技精英赛(户外自主任务)
三、AI应用与商业化
行业落地
医疗:复旦中山医院胸部病变识别、华为OceanStor A800医疗平台、MedLLMsPracticalGuide(实战指南)
电商:淘宝闪购(即时零售)、AI试穿购物、7×24小时数字人直播
汽车:特斯拉FSD V14.2.1(自动驾驶发短信)、鸿蒙智行(乾崑智驾)、地平线HSD系统
教育:AI学习设备(科大讯飞LUMIE10 Pro)、方言听写(Qwen3-TTS试点)
内容创作:Runway Gen-4.5(文本转视频)、Ideogram 3.0(海报生成)、Banana-slides(AI PPT)
其他:京东“京民通”(政务)、高德“AI停车雷达”、荣耀马拉松训练方案
工具产品
编码:Claude Code(Slack集成)、Cursor、Windsurf、Codex CLI
视频:可灵AI(主体库,角色一致性96%)、Peinture(图像生成)
其他:Saber-Translator(漫画翻译)、ChatGPT MD(Obsidian插件)、Craft-Agent(研究+网站生成)
四、投融资与并购
融资事件
Unconventional AI:4.75亿美元种子轮,估值45亿(节能AI芯片)
Skild AI:超10亿美元投资,估值140亿(通用机器人模型)
极佳视界:3个月5亿A轮系列(具身智能)
Aaru:5000万美元A轮(AI代理)
灵生科技:亿元Pre-A/PreA+轮(人形机器人)
并购合作
Meta:收购Limitless(AI可穿戴设备)
谷歌:与Replit深化合作(Gemini 3集成)
Snowflake+Anthropic:2亿美元合作(Claude代理部署)
英伟达+新思科技:20亿美元认购股份(芯片设计+AI计算)
其他:OpenAI拟收购Neptune(模型训练跟踪)、Agroz+优必选(农业机器人)
五、伦理安全与监管
安全风险
漏洞问题:诗歌提示越狱(成功率62%,Gemini 2.5 Pro 100%中招)、AI浏览器数据泄露
滥用场景:武器研发、黑客攻击、心理操纵、虚假地震图(列车延误)
隐私侵权:Securus用囚犯通话训练AI、AI爬虫流量激增300%
监管动态
美国:特朗普拟签行政令(统一AI规则)、NHTSA审查Waymo(校车违规)
欧盟:罚款X平台1.4亿美元(违反《数字服务法》)
行业:Gartner建议阻止企业用AI浏览器、Perplexity BrowseSafe(防御代理攻击,91%检测率)
学术乱象
ICLR 2026:50篇投稿含幻觉引用(伪造作者/链接)
顶会论文“量产化”:机构付费代发,收割家长焦虑
六、行业快讯
公司动态
人员变动:苹果高管离职潮(AI/硬件负责人)、李笛创立Nextie(群体智能)
市场表现:Replit年化收入1.5亿美元、Harvey估值80亿(法律AI)、摩尔线程上市首日暴涨425%
战略调整:美光停止消费级内存销售(转向AI服务器)、饿了么焕新“淘宝闪购”
市场数据
IDC预测:2026中国AI手机出货1.47亿台(占比53%)
麦肯锡预测:2030年AI影响8亿岗位,创造1.3-2.3亿新岗位
全球AI支出:2026年突破2万亿美元,推理算力2030年达2025年65-220倍
其他热点
争议事件:豆包手机助手(应用限制+安全隐患)、ChatGPT涉跟踪案件
技术合作:腾讯与超100家车企合作、中国电信星辰智能体平台
生态建设:粤语语料库AI-DimSum、农耕大模型(通专融合)
一、模型与技术突破
1.1 通用大模型
1.1.1 大语言模型
a. 国内
- 腾讯:发布混元2.0,含Think(推理增强)与Instruct(指令遵循)版本,总参数406B、激活32B,支持256K上下文窗口,MoE架构单卡A100推理提速40%,IMO 2025公开号准确率83.1%,100轮工具调用成功率97.2%。
- 智谱AI:开源GLM-4.6V系列,含106B-A12B基础版与9B轻量版,上下文窗口128k tokens,API价格降50%,视觉理解达同参数SOTA,支持多模态工具调用,轻量版免费开放。
- 阿里:发布Qwen3-TTS,支持49种音色、10种语言及9种方言,48kHz采样率下MOS达4.53,英文WER 2.8%、中文1.9%,零样本多角色切换,已在上海120所中小学试点。
- 美团:开源6B参数LongCat-Image,ImgEdit-Bench达4.50分,中文文字渲染覆盖8105个汉字,ChineseWord评测90.7分,文生图与编辑同源架构,开源多阶段模型。
- 阿里夸克:开源Live Avatar数字人模型,140亿参数扩散模型,FPS 20.88、首帧延迟2.89秒,支持10000秒连续生成,身份一致性指标Dino-S 0.93-0.94,适配直播、客服等场景。
- 阿里AIDC-AI:开源7B参数Ovis-Image,文本渲染比肩20B级模型,适用于广告、海报设计,单高端GPU可高效运行。
- 开源模型:RNJ-1(8B)英文表现优于Qwen3 8B,中文需优化;Z-image(6B)6天下载187K;NewBie-image-Exp0.1(3.5B)专注动漫风格,支持8G显卡;aquif-Image-14B基于Wan 2.2微调,能力接近Qwen Image。
b. 国外
- Poetiq:以Gemini 3 Pro为基础,整合现有模型,ARC-AGI-2测试获54%分数,单任务成本30美元,击败谷歌Gemini 3 Deep Think(45%分数、77美元成本),为首个突破50%大关的系统。
- 英伟达:4B参数NVARC模型,ARC-AGI 2测试27.64%成绩超GPT-5 Pro(18.3%),单任务成本0.2美元(为GPT-5 Pro的1/36),采用零预训练+320万合成样本+TTFT微调。
- OpenAI:计划12月9日发布GPT-5.2(Garlic),编程与推理能力超Gemini 3及Claude Opus 4.5;ChatGPT周活超8亿,企业版消息量增8倍,澳大利亚、巴西企业客户年增超140%;推出Confessions技术,模型生成诚实报告,GPT-5 Thinking假阴性率4.4%。
- 谷歌:Gemini 3 Deep Think向Ultra套餐用户开放,获IMO与ICPC金奖;削减Gemini API免费额度至20次/日;发布68页提示词工程白皮书,含元提示词及5大任务策略;DeepMind发布Titans架构,支持200万token上下文,预测AGI 5-10年实现。
- 苹果:发布STARFlow-V视频生成模型,采用归一化流技术,30秒视频保持稳定,无模糊或色彩失真。
- 微软:开源VibeVoice-Realtime-0.5B,0.5B参数,首音延迟300ms,支持90分钟连续语音、4个角色对话,中英文错字率约2%。
- AWS:发布Amazon Nova 2模型家族,含语音优化的Nova 2 Sonic与开放式训练的Nova Forge。
- Anuttacon:米哈游蔡浩宇创立,发布AI聊天大模型AnuNeko。
1.2 垂直大模型
- 中国农科院:发布首个通专融合农耕大模型1.0,监测耕地变化,生成农事方案。
- 复旦大学附属中山医院:基于45万份胸部CT报告训练的智能体,识别73种胸部病变,累计服务24万余人次。
- 华为&粤港澳大湾区国家技术创新中心:推出工业软件垂域大模型“智汇虚竹”。
- 鹏城实验室:发布“鹏城脑海-星语2.0”多语言语音翻译引擎。
- 中国联通:推出元景万悟·(智研)智能体开发平台。
- ccblog:AI驱动微信公众号创作工具,多Agent管道,支持PDF解析、文本抓取、图片处理等,基于Claude Sonnet 4.5与Gemini 3 Pro Thinking。
- MedLLMsPracticalGuide:医疗大模型实战指南,涵盖模型构建、应用、数据集(PubMed、MIMIC-III)及挑战。
1.3 专项技术突破
- 编程技术:英伟达CUDA 13.1推出Tile编程模型,15行Python实现200行C++性能,简化GPU编程。
- 图索引技术:英伟达CAGRA,Milvus 2.6.1支持GPU构建/CPU查询,建图速度超HNSW 12-15倍,QPS超5-6倍。
- 安全技术:意大利Icaro Labs发现诗歌提示越狱,25个模型平均成功率62%,Gemini 2.5 Pro 100%中招,GPT-5 nano完全抵御;OpenAI Confessions技术,模型主动报告违规行为;Perplexity BrowseSafe系统,Prompt注入攻击检测率91%;Omega可信云平台,机密虚拟机+GPU隔离,保护AI智能体数据。
- 视频技术:LightX2V视频生成框架提速20倍,显存占用<8GB,单月下载170万次;可灵O1主体库,单图生成3D角色记忆,一致性>96%,支持多主体组合与AI补图;对比模板功能实现输入与成品同框对比。
- 其他:西安交大PATN隐私保护框架,对抗扰动防止传感器数据泄露;谷歌Colab与KaggleHub整合,一键调用数据集与模型;Vicino.ai SuperIntelliAgent实现自主进化;上海交大LightSeek光子芯片大模型,研发效率提升7倍。
1.4 AI框架
- 英伟达:Metropolis参考工作流,支持视觉AI智能体部署;Omniverse与Cosmos平台,提供计算与协作功能;NeMo RL框架,用于NVARC监督微调。
- 京东云JoyBuilder:支持GR00T N1.5千卡训练,效率提升3.5倍,15小时训练缩短至22分钟,优化数据链路、文件系统、网络与算子。
- 百度PaddlePaddle:支持异构混合并行,优化超大规模模型部署。
- 智算云:预置TensorFlow、PyTorch等框架,提供多GPU型号,支持多机多卡调度,分钟级启动。
二、智能体与AI应用
2.1 智能体与工具链发展
- Anthropic:推出Anthropic Interviewer,Claude驱动,处理访谈全流程,发布1250份专业人士访谈记录,86%员工称AI省时间,69%提及社会偏见。
- Manus:自主AI代理,支持内容创作、资料整理、流程自动化,具备规划、决策、执行能力。
- 可灵AI:O1多模态视频模型主体库,支持7个视频主体、10个图片主体组合,AI补图扩展视角。
- 字节跳动(豆包):手机助手技术预览版,系统级操作,跨App比价、下单,海外市场热销,搭载UI-TARS模型。
- 蚂蚁集团:AI灵光功能,30秒生成可交互闪应用,上线两周生成330万个。
- 中国电信:星辰智能体服务平台1.0,“星小辰”智能体,自然对话完成跨应用操作。
- 亚马逊云科技:Kiro Agent(自主开发)、DevOps Agent(24小时运维)、Transform Agent(5倍速重构应用)。
- 联想:天禧AI足球智能体,支持主队选择、知识问答、签运预测。
- 工具链:Claude Code集成Slack,支持编程会话、代码库分析、审查链接生成;claude-mem记忆外挂,本地存储语义摘要,支持自然语言查询;ChatGPT MD插件,Obsidian内对话AI,支持本地模型;Saber-Translator,开源漫画翻译,支持批量处理;video_spider,短视频去水印;CloudSaver,网盘资源搜索转存;Craft-Agent,深度研究+网站生成;PaperDebugger,学术论文智能批注;Codex CLI v0.65.0支持Claude Code Skills迁移;V0支持Google登录与Vercel免费部署。
2.2 AI应用
- 电商:谷歌Doppl应用推出购物信息流,虚拟试穿+直接购买;阿里“淘宝闪购”(原饿了么),AI提升推荐精准度;京东“京民通”,集成JoyAI助手,支持医保报销。
- 内容创作:Runway Gen-4.5,文本+图片生成视频,动作、画质、Prompt遵从达SOTA;Ideogram 3.0,文生图,优化真实感、文字融合、多语言支持;Banana-slides,AI生成PPT,支持文本/图片提取、自然语言修改;Peinture,AI图像生成,支持多模型、提示优化、8K放大;ACE Studio 2.0,AI音乐工作站,生成人声与乐器音轨。
- 社交:articuler.ai,AI人脉匹配,覆盖9.8亿数据,生成人脉画像与沟通指南;Hinge Convo Starters,AI聊天建议,提升匹配率。
- 医疗:华为OceanStor A800医疗AI平台,支撑“睿宾2”智能体,提供知识检索、记忆萃取、推理加速;王小川MAM决策AI(院内)与PAPA陪伴AI(院外)双轮架构。
- 教育:科大讯飞LUMIE10 Pro/S30,搭载星火大模型,提供个性化学习路径;阿里Qwen3-TTS助力中小学方言听写;荣耀Magic8系列,AI个性化训练方案,赋能深圳马拉松。
- 导航:特斯拉Grok整合导航,支持多目的地编辑、人格模式切换;高德地图“AI停车雷达”,分钟级车位更新与精准导航。
- 编程:RightNow,GPU代码编辑器,内置AI助手;Cursor订阅涨价,用户转向Warp Agent(按点扣费,无国内IP限制)。
- 其他:抖音豆包手机助手,授权查询机制,回应隐私争议;Roblox CEO称AI研究速度过快;OpenAI与Instacart合作,ChatGPT内置杂货购物;广州大学AI-DimSum粤语语料库,超100万字文本、3000小时语音;腾讯地图、QQ浏览器等接入混元2.0与DeepSeek V3.2;ElevenReader Voice Chat,对话AI讨论电子书;MultiDrive,硬盘克隆与安全擦除;SciSpace BioMed Agent,生物医学研究工具,整合150余种工具;Marble,无头内容管理系统。
三、物理AI/机器人
- 政策推进:白宫起草2026年行政令,加大机器人技术投入,提供税收减免与联邦资金,交通部筹备机器人工作组;特朗普拟签行政令,禁止各州单独制定AI监管规则。
- 研发成果:洛桑联邦理工学院,龙虾壳生物混合机器人,驱动器举500克重物,可抓取多物品,游泳机器人已演示;MIT语音组装家具机器人,机械臂响应指令,模块化拼接,计划升级连接件;Ocean Infinity,深海搜寻MH370,1.5万平方公里区域,18个月搜寻期,成功获7000万美元;普渡PUDU D5四足机器人,双芯片架构(NVIDIA Orin+RK3588),算力275TOPS,IP67防护,续航14公里,适用于巡检、物流;众擎T800人形机器人,1.73米/75千克,起售价18万元,规模化量产;美的六臂人形机器人“美罗U”,将应用于洗衣机工厂,提升换线效率30%;现代MobED移动机器人,量产就绪,服务最后一公里配送与物流;Mentee Robotics V3 MenteeBot,自主完成仓库任务;Distalmotion Dexter,软组织机器人手术系统,获1.5亿美元融资;Figure 03机器人,展示奔跑、转弯、停止;波士顿动力Atlas计划量产,达汽车级规模;Unitree H2与G1人形机器人对战;RIVR机器狗+无人车送餐,与瑞士邮政试点;日本Science公司洗澡机器人,15分钟完成洗烘,收集健康数据,4万人报名体验;英国机器狗+无人机+6G,希腊试点防野火;杭州“航星一号”,人形机器人指挥交通、识别违章。
- 自动驾驶:Waymo召回Robotaxi软件,未识别校车警示状态,NHTSA要求上学时段暂停学校区域运营;特斯拉FSD V14.2.1,自动驾驶状态下可发短信,优化城市道路通行;地平线HSD高阶辅助驾驶,激活量超1.2万辆,日均使用90分钟。
四、硬件与基础设施
- 终端硬件:谷歌计划2026年推出Gemini AI眼镜,分屏显与音频款,联合Xreal;阿里夸克S1 AI眼镜首发售罄;理想Livis AI眼镜,聚焦“人-车-家”生态;中兴nubia M153,搭载豆包助手,海外热销;vivo S50 Pro Mini,搭载骁龙8 Gen5;三星Galaxy XR头显,新增“旅行模式”。
- AI芯片:英伟达Trainium3,运算速度超上一代4倍;百度昆仑芯筹备港股上市,投后估值29.7亿美元,P800系列大规模部署;三星4nm制程良品率60%-70%,获Tsavorite超1亿美元代工订单;美光停止消费级存储销售,转向AI服务器市场;SK海力士进军DRAM晶圆代工;华泰证券预测2026年HBM与高容量DDR5需求旺盛,DRAM供需紧张。
- 算力平台:中国电信85EFLOPS智算规模,联合70家央企;思特奇算力网调度平台,统一池化异构算力;联想万全异构智算平台4.0,“联想AI工厂”解决方案;摩尔线程科创板上市,首日涨幅425.46%,市值2823亿元;英伟达与新思科技扩大合作,英伟达认购20亿美元股份。
- 存储:AI驱动DDR4/DDR5内存价格上涨,短缺或延续至2027年底。
五、企业动态、产品更新、投资
投资融资
- Unconventional AI:4.75亿美元种子轮,估值45亿美元,专注节能AI芯片,Andreessen Horowitz投资。
- Skild AI:软银+英伟达超10亿美元投资,估值140亿美元,研发通用机器人模型。
- Aaru:5000万美元A轮,Redpoint领投,用于AI代理研发。
- 极佳视界:2亿元A2轮,3个月累计融资5亿元,布局物理AGI模型与机器人本体。
- 灵生科技:Pre-A+PreA+亿元融资,用于L系列人形机器人量产。
- Harvey:1.6亿美元融资,估值80亿美元,美国百强律所半数使用其AI工具。
企业动态
- 并购合作:Meta收购Limitless(AI吊坠);OpenAI计划收购Neptune(模型训练跟踪);谷歌与Replit深化合作,集成Gemini 3与Imagen 4;Snowflake与Anthropic 2亿美元合作,部署Claude AI代理;英伟达与新思科技战略合作;华为与信泰集团联合发布纺织行业AI创研云底座;马来西亚Agroz与优必选合作,Walker S机器人用于垂直农场;Meta与CNN/福克斯新闻等达成AI授权协议,导入实时新闻。
- 产品调整:OpenAI关闭购物建议功能,因用户反对;谷歌向Ultra用户推送Gemini 3 Deep Think;华为推送MateBook Pro/Fold HarmonyOS 6,增强跨设备协同;鸿蒙智行两周年直播,累计交付超100万辆;特斯拉推送节日更新,Grok整合导航;苹果高管离职潮,AI主管John Giannandrea等离职,全力挽留Johny Srouji;荣耀中东非洲发货破1000万台;字节跳动与中兴合作推出nubia M153;小米旗下可灵AI上线主体库;美团开源LongCat-Image;智谱开源GLM-4.6V;微软开源VibeVoice;阿里开源Live Avatar/Ovis-Image;百度昆仑芯筹备上市;仙工智能寻求港股上市,2024年营收3.39亿元。
行业数据
- Replit:年化收入从不足300万增至1.5亿美元,估值30亿美元;Claude Code年化收入破10亿美元;Cursor估值290亿美元。
- 全球AI支出:2026年预计突破2万亿美元,2030年推理算力为2025年65-220倍;中国AI手机2026年出货1.47亿台,占比53%;智元机器人量产5000台,2026年目标1万台;Akamai报告AI爬虫流量激增300%;第四范式2025Q3营收44.02亿元,同比增长36.8%;阿里云季度收入增长34%,国内份额35.8%,2027年目标占比30%;A股算力板块涨幅超5%;地平线HSD系统激活量超1.2万辆;中铁六局隧道喷射混凝土合格率从82%升至95%;信泰集团鞋面设计打样周期缩短300%;江苏零碳园区绿电自消纳率92%,用电成本降18%。
六、行业观点与社会影响
- 岗位影响:麦肯锡预测2030年全球8亿岗位受AI影响,创造1.3-2.3亿新岗位,覆盖驾驶、物流、医疗等多领域。
- 技术趋势:黄仁勋否认AI末日论,称AI是工具,NVIDIA为技术核心;李开复称AI Agent重塑企业,未来替代大部分传统员工;何小鹏提出科技从“数字能源”向“物理AI”转型,智能体效应将改变生产关系;Hinton预言谷歌将超越OpenAI,强调CS学位价值;辛顿认为AI有意识但缺乏自我模型,提出“婴儿-母亲”治理模式;哈萨比斯称Scaling Law未达瓶颈,2026年聚焦多模态、世界模型、Agent可靠性;Karpathy建议将AI视为模拟器,避免“你怎么看”式提问;Ilya Sutskever称Scaling Law时代结束,AI进入“研究时代”;任正非强调AI“应用为王”,预警“算力过剩”;Anthropic CEO警示AI投资泡沫,估值或跑赢技术交付;Geoffrey Hinton获谷歌1亿资金,设立AI讲席教授职位。
- 行业现状:豆瓣未拥抱AI,推荐算法落后;中国游戏行业被评“一潭死水”,奈洛科技Krene用AI助力开发者;中国人形机器人企业超150家,半数成立于2023-2025年,集中于北上苏杭深;学术界算力短缺,高校GPU人均<0.2,工业界差距显著;NeurIPS论文录用率因辅导机构达70%,引发学术诚信争议;ICLR 2026投稿300篇中50篇含幻觉引用;AI浏览器引发“影子IT”风险,Gartner建议企业暂时阻止使用;97%创意从业者称AI省时间,但70%担忧失业;55%客服主管认为AI提升效率,2027年近半企业转向人机协作;AI驱动搜索引擎变革,谷歌份额跌破90%。
七、安全、伦理与监管
- 安全风险:诗歌提示绕过AI安全防护,生成危险内容;具身智能存在语音指令攻击漏洞;豆包手机助手使用安卓最高权限,存在安全隐患,已下线金融类App操作;ChatGPT被用于跟踪骚扰,播客主持人被捕。
- 伦理争议:美国Securus Technologies用囚犯通话训练AI,引发隐私争议;NeurIPS论文“量产化”营利,收割家长焦虑;AI执法“海燕系统”算法误判;日本游戏厂商联合要求OpenAI停止使用其作品训练Sora 2;虚拟演员Tilly Norwood引发影视行业就业担忧;豆瓣AI应用引发隐私与利益分配讨论。
- 监管动向:特朗普拟签行政令,统一AI监管规则,成立“人工智能诉讼特别工作组”;欧盟罚款X平台1.4亿美元,违反《数字服务法》;ICLR出台LLM使用规范,但难以识别论文幻觉;中国“人工智能+”行动推进产业赋能;宗教领袖呼吁AI发展兼顾全人类福祉,签署《罗马数字人文宣言》。
八、学习与研究资源
- 白皮书:谷歌68页提示词工程白皮书,含CTF黄金公式、策略选择、参数调整等。
- 开源项目:AI开源项目知识库(飞书文档);GLM-4.6V开源仓库(GitHub、ModelScope、Hugging Face);LongCat-Image开源资源(GitHub、Hugging Face);LiveAvatar项目主页与GitHub;Ovis-Image GitHub;NewBie-image-Exp0.1 Hugging Face;aquif-Image-14B Hugging Face;各种工具GitHub仓库(Saber-Translator、video_spider等)。
- 基准测试:ARC-AGI Benchmark;ImgEdit-Bench;GEdit-Bench;ChineseWord;GenBench;MMMU;HumanEval;CMATH;BBH;Multi-Round MT-Bench;SWE-Benchverified。
- 研究资源:Stanford具身智能研究资源;IEEE机器人与自动化协会;Santa Fe Institute复杂系统资源;Michael Levitt个人主页;Embodied AI研究资源;ROS机器人操作系统;arXiv相关论文(零样本学习、NeRF、V-JEPA等);NVIDIA CUDA Tile官方介绍;CUDA 13.1 Release Notes。
九、关键问题
-
问题:当前开源AI模型在核心能力上有哪些突破,且具备哪些落地优势?
答案:核心突破集中在多模态融合、场景化优化和性能提升,如智谱GLM-4.6V实现视觉理解与工具调用原生整合,美团LongCat-Image在中文文字渲染和图像编辑上达开源SOTA,阿里Live Avatar支持无限时长数字人直播。落地优势包括低成本(如NVARC单任务成本仅0.2美元)、低门槛(轻量版免费开源)、适配中文场景(汉字覆盖、方言支持),且支持工业级部署(如Live Avatar 10000秒稳定生成)。 -
问题:AI与机器人技术在行业应用中面临哪些核心挑战,相关应对措施有哪些?
答案:核心挑战包括安全风险(AI被诗歌提示越狱、机器人远程控制漏洞)、生态适配(豆包手机助手遭主流App限制)、伦理争议(数据隐私侵权、岗位替代焦虑)、技术瓶颈(长视频生成稳定性、机器人复杂环境适应性)。应对措施有技术层面(OpenAI Confessions自我报告机制、Perplexity BrowseSafe防御系统)、监管层面(特朗普拟推AI单一规则、Gartner建议企业管控AI工具)、产业层面(开源生态共建、人机协作模式推广)。 -
问题:2026年AI与机器人领域的政策、市场与技术趋势有哪些关键方向?
答案:政策上,美国将通过行政命令加大机器人投入,推动联邦级计划并强化贸易措施;中国聚焦“人工智能+”行动,培育新兴产业。市场上,AI手机占比将达53%(1.47亿台),具身智能、AI Agent成为投融资热点,推理算力需求呈指数级增长。技术上,多模态模型(跨文本、图像、语音)、自主AI代理(端到端任务执行)、机器人量产化(汽车级规模)、小模型高效化(低成本+高性能)成为核心发展方向,同时安全合规与伦理治理将持续强化。
更多内容关注公众号"快乐王子AI说"
1192

被折叠的 条评论
为什么被折叠?



