- 博客(806)
- 收藏
- 关注
原创 豆包2.1 Pro模型发布,Coding与Agent能力跨越“质变点”
谭待以实践案例展示了模型的Coding和Agent能力:在一项芯片设计 RTL的测试中,豆包2.1 Pro连续运行近18小时,经历9轮迭代,还跑通了仿真、测试、综合检查等完整工程流程,展现出模型在真实工程场景里的生产级 Coding 交付能力;6月23日,火山引擎在北京举办2026夏季FORCE原动力大会,集中发布豆包大模型2.1,以及视频、图像、音频等多款新模型,并升级面向Agent的云服务体系。目前,豆包2.1模型已在火山引擎开放API服务,并陆续接入豆包、TRAE、扣子等产品。
2026-06-23 17:22:21
40
原创 2026北京智源大会开幕 | 从“悟道”到“悟界”,智源研究院推动人工智能、物理世界和生命科学“三体互动”
2026年6月12日,第八届“北京智源大会”在中关村国际创新中心开幕。北京智源大会是智源研究院主办的“AI内行学术盛会”,以“技术前沿、国际视野、青年人才”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。本届大会,现代数字安全体系奠基者Whitfield Diffie线下参会,聚焦Agent时代的安全与可信挑战;强化学习奠基人Andrew Barto追问“交互驱动智能”对于下一代AI系统的意义。
2026-06-12 14:31:57
386
原创 《2026 OpenClaw 类自主智能体发展白皮书》正式发布 | 中科算网算泥社区
日常寒暄、错误尝试的日志、重复性操作记录等信息噪音,如果不加清理,会稀释有价值的记忆,降低任务质量。它维护着所有已配置模型供应商的信息,根据任务特征(复杂度、领域、语言)自动选择最合适的模型。会话启动时,系统根据配置加载最近几天的记忆文件,构建启动上下文,为大模型提供必要的背景信息。被过去的系统提示、错误记忆或用户内容误导。),有长期记忆,能在没有用户指令的情况下主动扫描环境变化、触发任务、甚至给自己制定日程。通过可安装的技能包或插件,系统的能力可以被社区或用户自己持续扩展,而不需要修改核心代码。
2026-05-20 17:33:24
316
原创 重磅启赛!具身机器人AI算法大赛 昇思×书生双赛道等你来战
本次大赛,由湖北工业大学牵头主办,联合湖北人形机器人创新中心、湖北人形机器人产业联盟、昇思MindSpore开源社区、模力方舟、书生开源社区、AIGC开放社区、OPENLOONG社区、华中科技大学、武汉工程大学等权威单位联合主办,聚焦人形机器人空间感知领域。本赛道由湖北工业大学、湖北人形机器人创新中心、昇思MindSpore开源社区、模力方舟联合打造,以昇思MindSpore为技术底座,依托国产算力,主攻机械夹爪姿态估计核心技术,为精密装配、智能分拣等工业场景提供感知支撑,研发高精度、高适配的融合模型。
2026-05-15 11:16:22
289
原创 《2026 Agent Skills技术与安全白皮书》正式发布 | 中科算网算泥社区
技术人员、企业决策者、安全从业者和生态建设者提供一份系统、深入、可操作的参考指南。,直接推高成本和延迟。更致命的是,上下文越长,模型在关键信息上的注意力越容易稀释。封装成了独立、可复用、可组合的模块。项目的目录结构、团队的技术栈选择、代码风格规范、测试框架用法、部署流程。协议,定义了工具发现、数据检索、命令执行和提示模板等标准化交互模式。里告诉模型所有信息:你是谁、你要做什么、怎么判断、输出什么格式。我们这个项目的目录是这样的,配置文件在哪儿,测试用例在哪儿。项目的技术规范、团队的最佳实践、行业的。
2026-04-24 15:21:54
549
原创 百度“龙虾” 全家桶亮相,多款龙虾产品上新,家用小度虾也来了
目前,百度搜索已成为当前“小龙虾”用户的必装Skill。3月12日,百度又推出了全球首款手机龙虾应用“红手指Operator”,在当天活动上,红手指Operator宣布正式更名为RedClaw,让用户的养虾体验可以延伸到手机端,只需安装注册红手指Operator应用后,即可直接指挥“手机龙虾”执行任务。3月17日,在百度AIDAY龙虾专场上,百度“龙虾”全家桶正式亮相,包括“云端虾”、“手机虾”、“安全虾”多款产品上新,并发布全新自研“桌面虾”产品DuMate和全球首款“家用小龙虾”。
2026-03-17 18:17:42
272
原创 加速AI进产业,百度伐谋发布同舟生态伙伴计划
在汽车研发领域,亚洲领先的独立汽车设计科技公司阿尔特,基于其 AI 战略核心平台“太乙”,在风阻智能预测方面与百度伐谋深度合作,双方以真实工程数据和设计场景为基础,将风阻预测问题抽象为一个多目标、可演化的算法优化任务,通过运行结果的持续回灌,不断调整模型结构,使预测模型在演化过程中逐步逼近最优解。在生产级方面,百度伐谋生计企业级能力保障,全新发布的本地评估方案,通过“云端生成算法+本地完成评估”架构,让算法在云端生成后下载到客户本地,基于本地业务数据完成评估后,仅需将结果指标回传云端。
2025-12-25 18:19:51
1203
原创 《2025提示工程从入门到进阶指南》正式发布 | 中科算网算泥社区
12 月 11 日,《2025 提示工程从入门到进阶指南》正式发布!该指南由中科算网算泥AI开发者社区主编,旨在为大家打造一份全面、深入且极具前瞻性的 “2025 提示工程知识地图”。我们深知,面对 AI 浪潮,你想要的从来不是零散的技巧堆砌,而是一套能落地、可复用的系统性方法论,一种能读懂 AI 逻辑、精准引导其行为,进而实现高效人机协同的 “第二语言”。因此,本指南将从基础概念起步,层层深入前沿实践与核心思想,帮你搭建完整的知识体系,最终站在时代前沿,从容把握人机协作的未来图景。以下为指南部分内容节选。
2025-12-11 14:44:02
1152
原创 AI赋能光影梦 亦城创意绽芳华——2025 AI视听创作嘉年华总决赛圆满落幕
蜂翼工作室的《新苍穹》、笑尘的《亦城·升腾》、辉曼的《亦家》、纫玉的《亦庄·未来智慧之城》获得三等奖。另有《亦庄墨影·光承》《花丝镶嵌亦庄潮》《3035亦城·未来》等22部作品获评优秀作品奖,这些作品涵盖了AI绘画、视频生成、3D建模、音乐合成等多个创作方向,充分展现了创作者在AI视听领域的积极探索成果。北京经开区工委宣传文化部有关负责人表示,作为经开区推动“科技+文化”深度融合的重要实践,本次嘉年华不仅搭建了创作者交流的平台,更集中展现了“亦城智慧”与“亦庄智造”的硬核实力。
2025-12-01 12:00:20
481
原创 2025 AI视听创作嘉年华晋级名单揭晓,总决赛11月25日启幕
参赛作品视角多元、创意十足,既有《亦庄花开》《水墨亦庄》等聚焦区域人文与生态之美的作品,也有《3035 亦庄浮空城》《亦城未来式》等畅想未来科技生活的佳作,更有《花丝镶嵌亦庄潮》《绣绘亦庄》等融合传统文化与现代产业的创新表达,立体化呈现了经开区在科技成果转化、产业生态构建、创新文化培育等领域的蓬勃发展态势。作为2025北京国际视听大会的重要配套活动,这场以“科技+文化”为核心的创作盛会,自11月初启动以来便点燃了创作者的热情,吸引了326名创作者踊跃参与,全方位展现了经开区的创新活力与产业魅力。
2025-11-24 15:42:38
397
原创 《2025 AI 大模型开发生态白皮书》正式发布 | 算泥社区
但从长远看,开源生态的快速迭代、群体智慧和更广泛的应用渗透,可能催生出更具韧性和多样性的创新,最终在整体上形成更强的产业竞争力。对于开发者而言,开源意味着更高的自主性、更低的成本和更灵活的定制空间,但也需要更强的技术能力来驾驭和优化模型,这对中国的。家教,不仅能判断学生的答案是否正确,更能理解学生的解题思路错在了哪里,并能像一个有经验的老师一样,循循善诱地、一步步地引导学生掌握正确的思维方法。模型的、具有高带宽网络和海量内存的计算集群,这对数据中心的基础设施提出了极高的要求。这比人类的主观偏好要可靠得多。
2025-11-07 21:17:19
2787
原创 “AI幻想·未来亦城”2025AI视听创作嘉年华作品征集来了!
2025AI视听创作嘉年华作品征集活动。无论你是AI技术开发者、视听创作者。都可用AI影像、AI MV等。“AI幻想・未来亦城”在AI驱动创意的时代。
2025-11-03 12:25:40
197
原创 120万奖池,寻找最具想象力的AI创意开发者!2025骁龙人工智能创新应用大赛正式启动!
两大主赛道,全面覆盖从个人创意到行业落地、从强性能计算到移动便携体验的多种AI应用场景,自由选题,激发你对AI应用的所有想象!诚邀开发者、团队、企业,基于骁龙平台,共创高效、实用、突破想象力的AI应用!面向有行业落地经验的企业或团队,聚焦某一垂直行业场景(如金融、制造、营销等),构建基于AI PC的。面向AI PC平台的“广义创新探索”,不限场景、不限行业,强调新颖性、通用性与技术挑战性。本地运行的AI应用,结合多模态感知与前沿模型,打造高效、安全、个性化的智能终端体验。
2025-10-23 01:14:58
528
原创 谷雨互动赵乾坤 | AI答案时代生存法则:从流量变迁到GEO实践
在10月10日算泥社区MVP分享栏目中,拥有超20年前沿AI技术应用于Martech实战经验的谷雨AI创始人赵乾坤博士,聚焦「AI 答案时代生存法则:掌握 GEO,抢占未来流量入口」主题,深刻指出这一变革的核心在于用户心智的迁移——从主动搜索转向依赖AI生成答案。与SEO不同,GEO不仅关注信息展示,更着眼于AI的行动力,未来可能通过API接口将产品和服务纳入大模型的行动体系中,直接促成交易。而今,我们正处在大模型蓬勃发展的新时代,用户对AI答案的依赖度日益提高,这彻底改变了流量获取和用户决策的流程。
2025-10-17 13:43:28
778
原创 《AI大模型与异构算力融合技术白皮书》正式发布 | 算泥社区
10月10日,由中科算网科技有限公司、算泥AI开发者社区联合主编,中国科学技术大学苏州高等研究院联合发布的《AI 大模型与异构算力融合技术白皮书》正式发布。白皮书精准聚焦当前大模型开发领域的核心痛点,致力于为开发者提供全面且实用的技术参考,助力推动大模型与异构算力实现深度融合。展现了中国在大模型训练效率优化方面的实力。大模型训练对算力的需求呈现出前所未有的增长态势前沿模型的训练成本正以惊人的速度膨胀。大模型训练和推理的高算力需求带来了巨大的成本压力。高昂的算力成本成为大模型技术普及和应用落地的重要障碍。
2025-10-13 15:26:29
849
原创 国产王炸!上海AI Lab开源Lumina-DiMOO,开创多模态理解与生成新范式
上海人工智能实验室,上海创新研究院,上海交大,南京大学,悉尼大学,港中大,清华,共同推出了被誉为新一代多模态生成与理解统一模型的Lumina-DiMOO。“An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding”,翻译过来就是“面向多模态生成与理解的全方位扩散大语言模型”。关键词:“全方位”。这背后藏着它的独门绝技——“全离散扩散架构”。
2025-09-16 17:23:00
1292
原创 干货!2025年AI Agent超100页全景报告:MCP、RAG、实战案例
同时,探讨了智能体的5大设计模式Reflection反思、Tool use工具使用、ReAct推理行动、Planning规划、Multi-Agent多智能体及5级能力体系基础响应者、路由模式、工具调用、多智能体、自主模式,以及人-智能体的协作模式。9、多智能体书籍撰写:通过多智能体协同工作,只需给定书籍标题,就能自动完成书籍框架搭建、章节内容创作、逻辑校验等流程,最终生成一篇2万字左右的完整书籍,其中不同智能体分别负责主题调研、章节规划、内容撰写、格式优化等环节,大幅降低书籍创作的时间成本。
2025-09-15 17:35:09
1104
原创 估值超1800亿美元!大模型平台Anthropic完成130亿美元融资
ICONIQ的合伙人Divesh Makan表示,Anthropic正处于一个非凡的轨迹上,结合了卓越的研究、技术领导力和对客户的不懈关注。我们很荣幸能与Dario和他的团队合作,我们在Series F中的领投反映了我们对他们的价值观和塑造负责任AI未来的信念。Anthropic的成功得益于其领先的技术人才、对安全性的关注以及前沿研究,包括开创性的对齐和可解释性工作,这些都支撑了其模型的性能和可靠性。仅仅八个月后,到2025年8月,其年化收入已超过50亿美元,使其成为历史上增长最快的技术公司之一。
2025-09-03 13:16:10
535
原创 腾讯开源WMT2025冠军大模型:拿下30个第一,同类最佳
腾讯研究团队训练了一个包含约 300 万对的大型平行语料库,该语料库来自五个主要来源:开源的 Flores-200 基准的开发集、以往WMT测试集、人工标注的普通话与少数民族语言对、使用 DeepSeek-V3-0324 生成的合成平行语料库以及用于增强模型对一般和翻译相关指令泛化能力的通用和面向机器翻译的指令调整数据集的20%部分。对于双语数据,团队则利用公开的平行语料库,如 OPUS 和 ParaCrawl,并采用参考无关的质量估计指标,如 CometKiwi,对句对进行筛选,以确保所选句对的高质量。
2025-09-02 17:13:59
1349
原创 高效大规模创新3D重建模型iLRM
通过将每个视图的Plücker射线嵌入划分为非重叠的块,并将其重塑为一维向量,研究人员能够生成一个紧凑的视点标记集合。在交叉注意力层中,视点标记通过与图像标记的交互进行更新,从而引入视觉信息。这种训练目标不仅关注重建图像的像素级准确性,还考虑了图像的视觉质量,从而使得模型能够生成高质量的三维场景表示。这些图像标记不仅包含了输入图像的视觉信息,还融合了相机姿态信息,为三维重建提供了丰富的上下文线索。在架构设计的起始阶段,iLRM采用了视点标记化模块,其作用是将输入视图的相机姿态信息转化为模型可以处理的格式。
2025-09-01 17:56:47
808
原创 OpenAI刚刚发布GPT-Realtime,AI Agent进入超逼真对话时代
而可复用提示功能则允许开发者像在Responses API中一样,保存并在多个Realtime API会话中重复使用提示,这些提示涵盖了开发者消息、工具、变量以及用户/助理示例消息等丰富信息,为开发工作带来了极大的便利,有效减少了重复性劳动,提高了开发效率。值得一提的是,该系统并非将图像视为实时视频流,而是巧妙地将其类比为在对话中插入的一张图片,开发者可通过应用自主决定向模型分享哪些图像以及分享的时机,从而牢牢掌握模型看到的内容与响应时机,实现更加个性化、精准化的交互体验。
2025-08-29 14:06:14
1054
原创 专治智能体盲跑!微软发布AI Agent 5大可观测性,打通任督二脉
Azure AI Foundry 使用 GitHub Actions 和 Azure DevOps 扩展与你的 CI/CD 工作流程集成,使你能够在每次提交时自动评估智能体,使用内置的质量、性能和安全性指标比较版本,并利用置信区间和显著性检验来支持决策——帮助确保你的智能体的每个迭代都已准备好投入生产。例如,教育领域AI智能体,根据治理规则,它必须过滤暴力教学方法歧视性内容,若有用户问“怎么惩罚不听话的学生”,智能体会拒绝回答并引导正确教育方式,避免违反教育行业伦理和监管要求。智能体是强大的生产力助手。
2025-08-28 11:19:40
1479
原创 当AI成为预言家:大数据时代,我们正在失去理解世界的能力吗?
最近,我在斯坦福大学的一篇文章中读到了神经科学家Grace Huckins的观点,她提出了一个令人深思的问题:"虽然强大的AI工具和海量数据集正在推动实际进步,但它们可能没有深化我们对宇宙的理解。这句话像一记重锤,敲在了我的思考深处。在这个AI大爆炸的时代,我们每天都在惊叹于技术的进步:AlphaFold预测蛋白质结构的准确性超越了实验方法,大型语言模型能够写出看似有深度的文章,AI系统可以识别出人类肉眼无法察觉的模式...但是,这些进步真的让我们更理解这个世界了吗?
2025-08-26 11:19:31
462
原创 马斯克开源新模型:能实时抓取社交平台数据,20万块H100训练
金融与经济分析领域,模型可实时整合X平台的财经大V观点、机构研报摘要和市场情绪数据,结合历史交易数据进行趋势预测,例如,当用户提问 “某公司股价暴跌原因” 时,Grok-2.5会引用X平台的实时讨论例如,某大公司CEO的推文、分析师的解读,并结合财报数据生成多维度分析报告。与其他同类大模型相比,Grok-2.5最强功能就是可以实时抓取社交平台X(也是马斯克的)数据,例如,用户想询问今日NBA比赛结果时,会自动检索X平台的实时讨论和权威媒体发布的比分数据,生成包含赛况分析、球员表现的综合回答。
2025-08-25 13:39:25
817
原创 AI Agent接管谷歌搜索!预订餐厅、定制搜索结果,一键搞定所有事
例如,在寻找个性化工作时,Project Mariner会利用简历中的信息在 Climatebase 上查找合适的工作列表,通过多步骤推理实现常规任务的自动化,为用户腾出时间处理其他事务;”,AI会利用用户之前的对话,以及用户在搜索和地图中搜索或点击过的地点,提供更相关的选项,这些选项是针对用户个人定制的。之后,它会浏览和交互网站来执行计划,并随时向用户通报情况,用户可在任何时候进一步提示Agent,或完全停止Agent操作,接手其正在进行的工作。个性化推荐和预订选项会让AI模式在日常规划中变得更实用。
2025-08-22 10:49:52
618
原创 突发!DeepSeek刚刚开源V3.1-Base
该模型拥有 6850 亿参数,支持 BF16、F8_E4M3、F32三种张量类型,以Safetensors格式发布,便于高效推理,还具备扩展的上下文窗口。Hugging Face联合创始人Clement Delangue特意发了推文祝贺,他表示,Deepseek V3.1 已经悄无声息地发布,没有附带模型卡片,却已登上 Hugging Face 趋势榜第四位,太有意思了。我试着在我的 4GB 显卡上加载新的 DeepSeek-V3.1-Base 685B 模型,结果它崩溃了,不知道为啥?
2025-08-20 12:28:03
382
原创 超58000星!精选AI Agent、MCP开源大合集,Github每日第一
它支持多种页面交互功能,包括更新、插入、检索内容,创建和编辑块、列表、表格等 Notion 结构,添加评论,搜索特定信息,且能记住对话上下文以支持多轮交互,同时提供会话管理确保对话的持久性。Hybrid搜索RAG,主要提供混合搜索能力融合语义匹配与关键词检索提升文档召回率,支持 PDF 文档上传处理,自动完成文本分块与嵌入,当文档信息不足时会调用 Claude 的通用知识补充,通过 Streamlit 提供直观的聊天界面,平衡了文档特定知识与通用智能的优势。不仅适合新手,开发老鸟也可以学习借鉴下启发灵感。
2025-08-18 15:19:20
890
原创 微软发布5大AI Agent模式:一键解锁AI员工,打造智能体工厂
例如,JM Family采用这种方法,部署了业务分析师/质量保证Genie,为需求、故事编写、编码、文档和质量保证部署智能体。目前,微软的Azure AI Foundry已经支持多Agent模式开发,每个业务域的智能体被封装成独立模块,接口即协议,团队 A 的订单解析智能体可以零改动嵌入团队B的物流调度流程,知识、策略、甚至合规规则都能在组织间复用。与传统的RPA、自动化脚本相比,智能体除了提供自动化之外,还能根据实际业务场景进行推理、协作、弥合知识与成果之间的差距,挖掘出全新的见解,提供更高的商业价值。
2025-08-14 14:31:46
1037
原创 宣战马斯克!OpenAI进军脑机接口,Altman圆8年前梦想
它们按照创造者设定的目标进行优化,但优化方式复杂到人类无法破解——以今天的标准来看,它们已是复杂的人工智能,而到了明天,这或许就像儿戏一般简单。或许人们不再使用“奇点”一词的另一个原因是,它暗示着某个单一的时间点,而如今看来,“融合”更可能是一个渐进的过程。更重要的是,除非我们先自我毁灭,否则超人类人工智能终将出现,基因增强终将实现,脑机接口也终将成为现实。在OpenAI工作期间,我最惊讶的发现是,计算能力的提升与人工智能的突破之间存在极强的相关性,而从事人工智能研究的精英人才数量也在以指数级增长。
2025-08-13 11:32:38
518
原创 免费使用GPT-5!一手实测案例,代码能力强的离谱
我们先试试GPT-5的拿手好戏代码能力,输入提示词:用 JavaScript 结合 HTML5 Canvas 开发一个打砖块网页游戏,要求,包含可移动的挡板,通过鼠标或左右键控制、随机位置生成的砖块矩阵,小球撞到挡板、砖块、上下左右边界时有正确的物理反弹效果,砖块被击中后消失,全部砖块消除则通关,小球掉落挡板下方则游戏结束。如果你想继续优化这个小游戏,比如不同的砖块对应不同的分数,给小球加上一些溅射的特效,得分更高,加上障碍等等,直接修改源代码就行了。例如,商品分类,轮番图,购物车这些实用功能。
2025-08-12 12:26:13
1060
原创 美国程序员失业率创纪录:17万本科生难就业,AI抢饭碗!
根据每年从约200所大学收集数据的非营利组织“计算机研究协会”的数据,去年美国计算机科学专业的本科生人数突破17万,是2014年的两倍多。高盛首席经济学家Jan Hatzius指出,造成这一现象的主要原因是,ChatGPT等AI助手的出现,极大降低了企业对程序员等IT人员的需求,正在逐步替代初、中级码农的工作。牛津经济研究院的美国高级经济学家Matthew Martin表示,目前非常不幸的是,特别是对于应届大学毕业生来说,最有可能被AI自动化取代的岗位,正是他们想要申请的入门级职位。
2025-08-11 15:54:48
878
原创 OpenAI刚刚发布GPT-5,免费使用、疯狂屠榜,一夜改写AI历史
在训练方法上,GPT-5的推理模型,包括GPT-5-thinking、GPT-5-thinking-mini和GPT-5-thinking-nano采用了强化学习技术。GPT-5首次使用了内嵌式三位一体集成架构,彻底颠覆了前代模型的独立运行模式,一共由3个核心模型组成,分别是处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking 深度思考模型、实时决策的路由机制,还有一个是额度使用完后启动的mini版本。Pro 订阅用户可无限使用 GPT-5,并能访问 GPT-5 Pro。
2025-08-08 11:20:37
1254
原创 快手提出强化学习创新框架RLEP,突破大模型推理瓶颈
具体来说,对于每一个输入问题,模型会根据当前的策略生成一组候选答案,这些答案通常是以推理轨迹的形式呈现,包含了从问题到答案的完整推理过程。RLEP通过记录模型在训练过程中成功探索到的高质量推理路径,并在后续的训练中重新利用这些路径,使得模型能够快速恢复之前的最佳性能,并在此基础上进一步提升。在每次训练更新时,模型会生成一组新的推理轨迹,这些轨迹是基于当前策略生成的,包含了模型对当前问题的理解和推理。这一阶段的目标是通过回放经验池中的成功轨迹,快速恢复模型之前的最佳性能,并在此基础上进一步提升模型的性能。
2025-08-07 12:24:46
444
原创 海外炸场的开源狠角色,MoE + 原生智能体,国产最强实锤?
7月28日晚,智谱悄无声息的开源了新一代旗舰模型 GLM-4.5,发布仅10小时,便引发全球媒体高度聚焦。正如技术博客所阐释,大语言模型的终极目标是在广泛领域达到人类认知水平,但现有模型往往各有所长(编程、数学、推理),却难以成为真正的“全优生”。特别是在衡量模型代码能力的权威榜单 SWE-bench Verified 上,下面咱们就详细看下:总参数355B,激活参数32B:总参数106B,激活参数12B它们都采用了,这个架构说白了就是“每次推理只激活部分参数”,在保证多样能力的同时大大降低了计算消耗。
2025-07-31 16:59:51
854
原创 数字化深水区里,中国企业到底需要怎样的AI应用底座?
数睿数据的做法恰是,其将原本面向企业数据侧服务的独立产品 ——“数据通” 所承载的数据工程能力,与面向企业软件侧服务的 “数字通” 所覆盖的软件工程交付流程体系,借助AI将能力和体系落地于smardaten 2.0,最终形成了能够帮助企业实现端到端交付的软件开发 Agent 产品。一个事实是,如果要将AI真正嵌入到整个低代码的开发流程中,服务商需要做到的不仅仅是对固有低代码组件模块的AI编排和调度,还需要基于不同成熟场景,如业务管理、决策分析等进行特定的深度思考,以通过多个Agent的协同完成复杂的任务。
2025-07-29 16:11:34
802
原创 重塑浏览器!微软在Edge加入AI Agent,自动化搜索、预测、整合
Copilot模式还支持自然语音导航,用户可以直接对Copilot说出自己的需求,无论是查找页面上的信息,还是让Copilot打开几个标签页来比较产品选项。在启用Copilot模式后,用户打开一个新的Edge标签页时,会看到一个简洁、精简的页面,其中只有一个输入框,将聊天、搜索和网页导航功能整合在一起。Copilot模式还能够引导用户完成任务,并将用户的浏览历史组织成有主题的旅程,提供下一步操作的建议,帮助用户保持专注并推动项目进展。此外,Copilot模式还提供标签筛选,理解意图的创新功能。
2025-07-29 11:31:01
4780
原创 Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工
然而,也有相当一部分管理者(超过20%)表示他们让人工智能在没有人类输入的情况下做出决策,要么总是(5%)要么经常(16%),还有24%的人有时会这样做。调查发现,大约65%的管理者表示他们在工作中使用人工智能工具,而在这些管理者中,有94%的人利用这些工具来对他们的直接下属进行决策。尽管人工智能在管理中的应用越来越广泛,但调查发现,只有三分之一(32%)的管理者表示他们接受过关于如何在管理人时合乎道德地使用人工智能的正式培训,而43%的人接受过非正式指导。她强调“在人员管理中,不能失去人的因素。
2025-07-25 12:15:06
430
原创 200万个AI芯片!OpenAI扩大5000亿美元投资,打造全球第一AI基建
这同时也标志着Stargate的一个重要里程碑,Stargate是OpenAI的人工智能基础设施平台,其长期愿景是将人工智能的益处普及到每一个人。与我们在德克萨斯州阿比林的Stargate I站点相结合,此次与甲骨文的额外合作将使我们的Stargate人工智能数据中心容量开发总量超过5吉瓦,能够运行超过200万颗AI芯片。包括运营Stargate数据中心所需的直接全职岗位、像在德克萨斯州阿比林的Stargate I站点工作的众多专业电工那样的短期建筑岗位,以及制造和当地服务等间接岗位。这个规模可太惊人了!
2025-07-23 13:58:25
722
原创 碾压DeepSeek V3!阿里开源新版Qwen-3,屠榜级断层第一
此外,它在多语言能力方面也有出色的表现,例如在MultiIF测试中得分为77.5,在MMLU-ProX测试中得分为79.4。例如,在知识类的MMLU-Pro测试中得分为83.0,在MMLU-Redux中得分为93.1,在GPQA中得分为77.5。在推理能力方面,它在AIME25测试中得分为70.3,在HMMT25中得分为55.4。还在多种语言的长尾知识覆盖方面取得了显著进步,并且在主观和开放性任务中与用户偏好的对齐度更高,能够生成更有帮助且质量更高的文本,同时增强了对256K长文本上下文的理解能力。
2025-07-22 13:52:59
888
原创 刚刚,OpenAI发布CoT监控,增强AI Agent自主能力
例如,可以开发基于推理模型的监控器,这些监控器可以利用模型内部的推理过程来检测潜在的恶意行为。也可以进行潜在推理能力的评估,这将测试大型语言模型在不外化推理过程的情况下进行推理的能力。此外,当前的CoT监控方法大多依赖于对模型输出的直接分析,但这种方法可能无法捕捉到模型内部的复杂推理过程。因此,需要开发更先进的监控技术,这些技术可以深入到模型的内部结构,以更全面地理解模型的决策过程。需要注意的是在当前的AI模型训练中,优化目标通常是让模型产生正确的输出,而不是优化其推理过程。
2025-07-16 10:10:56
707
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅