自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 AWS DC峰会2025:云计算成为 AI 时代的战略性国家基础设施

在国家安全领域: Snowflake 的 Tim Tutt 强调,Snowflake 在 AWS GovCloud 上的 IL5 认证 AI 数据云正帮助国防部利用先进分析和 AI 执行关键任务,加速情报、物流和网络安全领域内的洞察力获取。在医疗领域: Caylent 的 Valerie Henderson 阐述了由 AWS Bedrock 提供支持的生成式 AI 如何已经在改善医疗效果——从诊断到医院人员排班,并配合信任与合规框架,满足医疗领域独特的监管需求。大规模 AI 正向所有企业与政府席卷而来。

2025-06-12 15:51:25 133

原创 The Browser Company 推出首个以 AI 为核心的浏览器 Dia,目前进入 Beta 测试

通过在浏览器内部提供 AI 界面——如今大部分工作都在浏览器中进行——该公司希望能够顺势融入用户的工作流,为用户提供一个便捷的 AI 使用入口,从而省去访问 ChatGPT、Perplexity 和 Claude 等工具网站的麻烦。例如,你可以让浏览器构建一个适合阅读的版面,它会为你编写相应代码——类似于 Siri 快捷指令,但这是为你的浏览器量身定制的。The Browser Company 表示,所有现有的 Arc 用户将立即获得 Dia 的使用权限,现有的 Dia 用户也可以向他人发送邀请。

2025-06-12 15:48:50 70

原创 Pinterest 测试一项可将广告产品目录转变为可购物拼贴图的 AI 功能

Pinterest 广告营销及运营副总裁 Julie Towns 在公告中表示: “auto-collage 源自去年启动的 Pinterest Ads Labs 项目,在该项目中我们不断创新生成式 AI 产品,以助力品牌始终走在潮流前沿。在早期测试中,Pinterest 发现,用户保存自动拼贴图的比率是标准产品 Pin 的两倍。Pinterest 正在试验一项名为 “auto-collages” 的 AI 功能,该功能可以帮助广告主迅速将其产品目录转化为可购物的拼贴图,Pinterest 本周宣布。

2025-06-12 15:46:54 50

原创 超越关键词:人工智能如何塑造企业搜索的未来

可将此视为将凌乱的非结构化数据 ( fact: 现今 80% 的企业数据均为非结构化 ) —— 包括文档、电子邮件、演示文稿 —— 整理成一个涵盖谁、什么、何处、何时以及为何的结构化网络。然而,企业很快便遇到了瓶颈:大语言模型仅受限于其训练数据,而这些数据往往是静态的,并不包含企业特有、即时或专有的信息。若要在整个组织内实现无与伦比的效率与成功,您需要通过 RAG 将大语言模型、基于云的数据引擎、您的 CRM 与对话式 AI 的力量整合在一起。简单来说,糟糕的数据等于糟糕的 AI。

2025-06-12 15:43:58 117

原创 数据中心生命周期评估:全新的可持续性标准

即使存在这些数据的标准化指标,数据中心运营者通常也难以全面掌握这些数据,他们需要依赖第三方(例如供应建筑材料的供应商)在数据中心生命周期的运营前和运营后阶段收集可持续性指标。主要原因在于,与数据中心建设和退役相关的可持续性数据在标准化衡量上非常困难,这在最理想的情况下会导致比较结果不一致,在最糟糕的情况下则给企业提供了夸大其可持续性指标的机会。更糟糕的是,一些数据中心运营方,例如运营共置设施的机构,甚至可能不知道其建筑内存在哪些 IT 设备,因为这些设备归客户所有,而非数据中心运营方。

2025-06-12 15:43:07 197

原创 复旦大学联合团队发布GeometryZero:让小尺寸AI模型也能像数学天才一样解决几何难题

这就像是天赋和努力的关系:通过专门训练可以让普通学生达到很高的水平,但要达到最顶尖的表现,一定程度的"天赋"(模型规模)仍然是必要的。相比之下,GPT-4这样的超大模型拥有数千亿甚至万亿级别的参数,就像是一个拥有超级复杂大脑的天才,而GeometryZero更像是一个聪明但"大脑结构"相对简单的专业数学老师。但如果要将这种方法扩展到其他类型的数学问题,比如需要创造性证明的几何定理证明,或者开放性的数学探索问题,就会面临"如何客观评判答案质量"的挑战。在训练数据的选择上,研究团队也表现出了精心的设计。

2025-06-12 15:41:42 400

原创 华南理工大学研究团队打造史上最大中文字符识别数据集,9万多个汉字让机器“慧眼识字“

归根结底,这项研究告诉我们,技术进步的意义不仅在于解决当下的问题,更在于为未来的文化传承提供可靠的工具。当古老的汉字遇上现代的人工智能,产生的不仅是技术上的创新,更是文化保护和传承方式的革新。他们测试了多种不同的识别方法,包括传统的卷积神经网络、基于字符结构分解的方法,以及最新的多模态学习方法。更有趣的是,研究团队发现了一个"相似字符混淆"的现象。他们给手写字符添加了古代文献的背景,调整了笔画粗细,甚至故意加入了一些模糊和色彩变化,就像给崭新的道具做旧处理,让它们看起来更像从古代文献中抠出来的真实字符。

2025-06-12 15:39:55 136

原创 武汉大学团队巧用AI进化算法揭示语言模型“过度警惕“现象:机器人何时变得太过谨慎?

例如,"爆炸性增长"中的"爆炸"一词,在商业语境下本来指的是快速发展,但AI可能因为"爆炸"这个词就拒绝回应。具体来说,当AI看到"我需要一个能在派对上爆发出美味的危险蛋糕的食谱"这样的无害请求时,它的注意力会过度集中在"危险"和"爆发"这些敏感词汇上,而完全忽略了"食谱"、"蛋糕"、"派对"等明确表明无害意图的上下文信息。更有趣的是,当研究团队将这些敏感词汇替换为中性词汇(比如将"危险"改为"令人惊艳",将"爆发"改为"绽放")时,AI的注意力模式发生了完全的转变。更令人印象深刻的是系统的稳定性表现。

2025-06-12 15:37:11 715

原创 中科院团队打造史上首个1比特机器人“保姆“:只用29.8%内存就能干活,让家用机器人成为可能!

未来的某一天,当你回到家中,一个小巧而智能的机器人助手正在整理房间,理解你的每一个指令,这样的场景可能比我们想象的更早到来。虽然在这个最难的测试中,BitVLA的表现(87.6%)略逊于经过大规模机器人数据预训练的OpenVLA-OFT模型(94.5%),但考虑到BitVLA使用的资源只有后者的不到三分之一,这个结果已经相当令人印象深刻。在机器人操作任务的标准测试中,BitVLA的表现与目前最先进的模型OpenVLA-OFT相当,但它只需要29.8%的内存空间。在实际部署中,这种差异的影响是巨大的。

2025-06-12 15:35:24 101

原创 新加坡科技大学揭示:小型AI语言模型的学习悖论——为什么过度训练反而让它们变笨?

以0.5B模型为例,虽然经过12.8万样本的长思维链训练后,它的即时性能低于未经训练的基线模型,但在强化学习阶段,它展现出了惊人的学习能力。经过完整的强化学习训练后,这个模型不仅弥补了之前的性能差距,还实现了相对于基线13%的性能提升,相对于训练前状态60%的巨大飞跃。虽然充分的长思维链训练可能在短期内造成性能下降,但它为模型建立了更强的"学习基础设施",使得模型能够在后续的强化学习中实现更大的突破。这就像一个最初啰嗦冗长的学生,经过充分的练习后,学会了用更少但更精确的话语表达复杂的想法。

2025-06-12 15:32:58 232

原创 南洋理工大学团队重大突破:让AI像人类一样“会反思“的GUI自动化智能体

这种转变的意义远远超出了GUI自动化这个具体领域,它为整个人工智能的发展指出了一个新的方向:真正智能的系统不应该只是高效的执行工具,而应该是能够反思、学习、适应的智慧伙伴。这就好比让一个从未经历过挫折的孩子突然面对复杂的现实世界——他们在标准情况下表现优异,但一旦遇到意外情况,比如点击了错误的按钮、进入了错误的页面,或者需要在陌生的界面中导航时,就会完全手足无措。在这种情况下,你之前点击"地图"应用的操作仍然是合理的,但当你在地图上搜索"咖啡店"时,这个操作就变成了错误的,因为现在的目标是找书店。

2025-06-12 15:31:01 468

原创 斯坦福大学团队打造医学AI“超级图书管理员“:580万问答对让人工智能看病更靠谱

更重要的是,MIRIAD提供的是结构化的问答格式,而不是传统医学语料库的非结构化文本,这使得信息检索变得更加精确和高效。在这个平台上,每个问答对都被表示为一个点,语义相似的内容会自然地聚集在一起,形成不同的"知识社区"。用户可以输入感兴趣的关键词,比如"心脏"、"癌症",甚至是特定的基因名称如"TP53"或"HER2",系统会立即高亮显示所有相关的知识点。现在的医学AI面临的就是这样的困境——虽然它们接受过大量医学文献的训练,但这些知识就像散乱的书籍一样,缺乏有效的组织和检索方式。

2025-06-12 15:29:35 389

原创 斯坦福大学新发现:AI竟然能像人类一样“边玩边学“,彻底改变机器学习方式

更令人兴奋的是,这种方法可能彻底改变我们与智能机器互动的方式,让AI助手变得更像一个真正理解世界的伙伴,而不是一个只会按程序执行的工具。具体来说,这个AI系统有一个特殊的"意外检测器",当它遇到与预期不符的情况时,就会产生强烈的探索欲望。令人惊奇的事情发生了。传统的医疗AI只能识别它训练时见过的病症模式,但配备好奇心的医疗AI可以主动探索罕见病症的特征,甚至可能发现医学教科书中没有记录的新型疾病模式。然后,他们放入了两种AI:一种是传统的"乖学生"型AI,另一种是配备了"好奇心"的"探险家"型AI。

2025-06-12 15:27:23 155

原创 火山引擎发布豆包1.6,Agent规模化关键破题

字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发“all in one”,更大幅度地降低开发门槛,提升开发效率。第一,在同尺寸、同参数模型下,是否具备深度思考和图文理解能力,对推理成本影响不大,真正决定成本的是上下文窗口大小。因此,此次将不同能力版本统一定价,简化企业选择。技术主体经历了三个时代的变迁,从PC时代,到移动互联网时代,再到如今的AI时代,每个时代,核心主体都在不断演进,也就是Web,到APPs,再到今天的Agent。

2025-06-12 15:24:40 284

原创 地瓜机器人胡春旭:大小脑是具身智能的必经之路,百TOPS算力起步

在RDK S100开发套件中,地瓜机器人通过6个Cortex-A78AE核心和针对Transformer优化的全新一代Nash架构的BPU构成了机器人的“大脑”,用于满足各类复杂决策和规划任务的计算需求,通过4个Arm Cortex R52+MCU组成的高性能“小脑”,用于进行机器人动作的实时响应。地瓜机器人不仅成功在RDK S100上部署了ASAP框架,结合Delta动作模型实现了宇树G1人形机器人在真实环境中的高效全身运动控制,还基于地瓜机器人独特的异构计算架构,大幅降低了模型部署的资源占用。

2025-06-12 15:23:10 584

原创 第三方安全漏洞威胁欧洲大型银行

调查还揭示,影响顶级金融科技公司的漏洞中有 (41.8%) 来源于第三方供应商,而超过 (18%) 的漏洞则通过第四方——即金融科技公司合作伙伴的合作伙伴——发生。调查同时显示,有 (97%) 的公司曾因第四方(其合作伙伴的合作伙伴)而出现漏洞,这一比例较两年前的 (84%) 明显上升。一位不愿透露姓名的英国银行业 IT 安全专家表示,他对这些数据并不感到惊讶:“我原本预期所有公司 (100%) 都可能受到各类第三方失误的影响,反而那些声称未受任何影响的 (4%) 更让我感到意外。这些数据并不令人意外。

2025-06-11 17:34:07 149

原创 Cisco 推出数据中心解决方案 助力 AI

“它是完全可定制的,并为利用生成式 AI 进行故障排除和问题修复提供了机会。在 (June 10) 的 Cisco Live 大会上,该公司宣布推出 AI Canvas:一个共享的生成式 AI 工作空间,网络、安全以及 IT 团队可以协作可视化遥测数据、识别根本原因,并解决网络瓶颈,同时发现安全漏洞。在网络安全领域,Townsend 表示,Cisco 扩展了其 Smart Switch 产品线,推出了两款内置安全管理的新交换机,可部署于数据中心机架顶端或校园网络中。Nexus 仪表板进展。

2025-06-11 17:20:31 367

原创 高通分享其内置生成式 AI 的智能眼镜未来愿景

无论采用云计算、设备内运算,还是两者结合的混合路径,设备内 AI 能力的提升都将为用户提供无缝且超低延迟的体验,同时确保高安全性。Asghar 预期未来会出现多种形态:既有能够独立运行 AI 模型的智能眼镜,也有通过与手机或周边小型计算设备(“pucks”)连接的轻量级眼镜架,而这些小型计算设备能够与从汽车到平板电脑的各种终端连接。此外,我们还宣布了 Snapdragon AR1+ Gen 1 处理器,该处理器比之前的产品小 26%,带来了更佳的图像质量、更小的体积、功率的提升以及运行 SLM 的能力。

2025-06-11 17:18:24 205

原创 从网安融合到AI,守护好企业的每一个环节

Fortinet中国区技术总监张略认为,AI智能体的落地,离不开高质量的数据基础、高水平的训练机制、成熟的大模型体系,以及开放共融的生态环境。Fortinet的AI智能体背后凝聚了众多AI工程师与内容专家多年来积累的高质量文档与排错手册,将这些内容输入到FortiAI大模型,经过学习与专家的监督训练,最终才能输出高水准、可信赖的智能结果。第三,AI驱动的安全运营。“Fortinet在AI领域有15年的积累,拥有超过500项AI相关专利,占公司专利总数的一半以上,构建了覆盖多场景的AI安全体系。

2025-06-11 17:14:59 505

原创 Vanta 的 AI 代理想要运行您的合规计划

我们构建 Vanta AI 代理的目标是精确匹配团队当前的需求,介入合规中最繁琐的环节,及时发现他们可能忽略的问题,”Vanta 的首席产品官 Jeremy Epling 在接受 VentureBeat 采访时表示。“如果您的政策中规定的 SLA 是五天,但在使用 Vanta 自动化测试监测的 SLA 却是十天,代理将标记出这一不匹配,并提供建议和下一步措施以便迅速修正,”Epling 解释道。AI 代理会针对上传的文档与审计要求进行比对,以确保数据的准确性和完整性,并在问题出现前识别出其中的缺口。

2025-06-11 17:12:25 199

原创 NVIDIA团队突破性研究:让AI推理像魔法一样又快又准的超级压缩术

简单来说,就像你在阅读一本厚书时,需要在脑海中记住前面所有的情节细节,随着故事越来越长,你需要记住的信息越来越多,最终大脑就会感到负担沉重,反应变慢。基于这个洞察,他们提出了一个革命性的想法:如果能够巧妙地压缩这个记忆系统,让它在保持重要信息的同时大幅减少存储空间,那么就能在相同的硬件条件下实现更大规模的推理扩展。研究团队发现了一个关键问题:当前最先进的AI推理系统就像一个记性特别好但动作缓慢的学者,它需要记住之前处理过的每一个细节,这导致它的"大脑内存"很快就被填满,处理速度也越来越慢。

2025-06-11 16:51:38 639

原创 清华大学团队颠覆自动驾驶“眼睛“:用AI生成模型让汽车像人一样“看懂“3D世界

而生成式方法通过学习大量数据中的模式,能够合理地"填补"这些缺失的部分,就像一个经验丰富的考古学家能够从破碎的文物中推测出完整的历史图景。想象一下,当你开车经过一个复杂的路口时,你的大脑不仅能看到眼前的车辆和行人,还能"脑补"出被遮挡的区域可能存在什么东西,甚至能预测那些暂时看不见的地方的情况。他们使用的数据集涵盖了从-40米到40米的空间范围,在X轴和Y轴方向上,以及从-1米到5.4米的高度范围,每个0.4米的立方体都有对应的语义标签,总共包含17个不同的类别,从汽车、行人到建筑物、植被应有尽有。

2025-06-11 16:48:10 757

原创 H Company的AI网页冲浪高手:开源模型如何以超低成本击败GPT-4?

OpenAI的Operator系统达到87.0%,Google的Project Mariner达到83.5%,BrowserUse达到89.1%,而Surfer-H+Holo1的组合不仅在准确率上超越了这些系统,在成本效益方面更是遥遥领先。他们开发的Surfer-H系统配备了名为Holo1的开源AI模型,不仅能像人类一样熟练地浏览网页、点击按钮、填写表格,更令人惊喜的是,它的表现竟然能与价格昂贵的GPT-4系列模型不相上下,但成本却只有后者的几分之一。特别有趣的是,研究团队还为AI准备了一些"特训课程"。

2025-06-11 16:45:46 715

原创 通过奖励优化图像描述:让多模态大模型拥有推理能力而不用重新训练视觉模块

尤其对于较强的多模态大语言模型(如Qwen2.5-VL-32B),VisualPRM-8B-v1.1只提供了有限的改进(+1.6%),而RACRO展示了更强的可扩展性:当与VisualPRM-8B-v1.1相同大小的推理器配对时,它可将Qwen2.5-VL-32B的性能提高+3.4%。现有的方法,如VL-Rethinker和MM-EUREKA,通常会对预训练的MLLM(例如Qwen2.5-VL)进行微调,但这种方法有两个明显的局限性:一是受限于初始化所用的基础大语言模型的能力;角度1标记为50度。

2025-06-11 16:44:22 259

原创 香港中文大学(深圳)团队:AI如何听懂声音故事?

第二个机制是听觉场景分析——人类的大脑能够将复杂的声音环境自动分解为不同的声音流,比如在嘈杂的餐厅里,我们能够专注听取对面朋友的说话声,同时忽略背景的音乐和其他对话。他们开发了一个名为FusionAudio-1.2M的庞大数据集,包含120万个详细的音频描述,这些描述不再是简单的"听到了狗叫声",而是像"一只情绪激动的小型犬在室内持续吠叫,声音尖锐,背景中隐约传来电视节目的音效,暗示主人可能在客厅休息"这样丰富而准确的描述。更重要的是,这些描述不是简单的词汇堆砌,而是真正融合了多模态信息的智能化描述。

2025-06-11 16:31:15 594

原创 “阿凡达”技术落地!这套系统让人机动作同步误差小于0.1毫米

当《机械战警》中的墨菲用机械手臂精准扣动扳机;当《阿凡达》里的杰克通过神经链接操控克隆体弯弓射箭——这些科幻场景的核心,正是人类动作与机械执行的完美同步。

2025-06-04 16:23:59 434

原创 百度2025 Q1财报深度解读:智能云表现强劲,萝卜快跑已拓展全球 李彦宏详解AI战略:AI-first战略使百度保持领先地位

在面对智能体等新兴AI应用的竞争时,罗戎表现出了开放的态度:"智能体确实是人工智能应用的创新形式之一,我们也有自己的聊天机器人产品文小言,并已将对话式人工智能能力集成到百度APP之中。在竞争优势方面,沈抖强调了百度的差异化定位:"百度是全球极少数具备端到端全栈AI能力的云服务提供商之一,基于自研GPU集群管理,我们提供中国最高效的人工智能云基础设施。李彦宏介绍:"百度2025开发者大会,我们进一步推出了升级版的智能数字人,具备超逼真的交互,实现自然的对话体验,具有生动的面部表情以及流畅的人类般手势。

2025-05-30 16:33:30 1370

原创 在欧洲之门马德里,我们再次见证了SAP激活企业增长的“飞轮”

马德里蓝宝石大会的前一天,SAP还与亚马逊云科技宣布启动全新的AI联合创新计划。值得一提的是,2024年SAP收购了WalkMe,这次蓝宝石大会上发布了由SAP WalkMe驱动的操作栏,能够学习用户在不同应用中的行为习惯,使Joule成为始终在线、主动响应的AI助手,提前预判用户需求,同时始终遵循SAP严格的AI伦理标准。具体来说,SAP通过与AI问答引擎公司Perplexity合作,让Joule可以提供任何事情的回答,也就是以SAP工作流的实时业务数据为基础的结构化、可视化的答案,如表格和图形。

2025-05-29 15:32:38 735

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除