硅纪元视角 | OpenAI 打造 AI“监督员”CriticGPT，帮助识别大型语言模型中的“幻觉”

本文链接：https://blog.csdn.net/guijiyuantech/article/details/140038191

在数字化浪潮的推动下，人工智能（AI）正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展，捕捉行业动态；提供深入的新闻解读，助您洞悉技术背后的逻辑；汇聚行业专家的见解，分享独到的视角和思考；精选对您有价值的信息，帮助您在AI时代中把握机遇。

1 分钟速览新闻

英伟达股东大会：AI 新时代与黄仁勋薪酬增长
革命性 AI 突破：谷歌 Gemini 2，性能与成本的双重优化！
OpenAI 打造 AI“监督员”CriticGPT，助力提升智能模型的准确性
Oracle 引领 AI 数据库革命：HeatWave GenAI 重塑数据管理未来
智能驾驶的“军备竞赛”：端到端大模型与车路云一体化

全球 AI 新闻

一、英伟达股东大会：AI 新时代与黄仁勋薪酬增长

英伟达股东大会在短短 30 分钟内完成了多项重要议程，包括批准了黄仁勋在内的 12 位董事提名，通过了高管薪酬方案，以及确认普华永道继续担任独立注册会计师事务所。黄仁勋 2024 财年的薪酬增长 60%，达到 3400 万美元，与其业绩紧密相关。大会上，黄仁勋分享了对人工智能新时代的深刻见解，预测 AI 将推动价值 50 万亿美元的重工业实现自动化。

硅纪元视角 · 英伟达在 AI 领域的战略布局和技术创新具有划时代的意义。黄仁勋所描述的加速计算和生成式 AI 不仅重塑了计算架构，也为各行业带来了深远的变革。英伟达通过构建全栈式解决方案，不断推动技术边界，实现了从芯片到系统、再到软件和算法的优化。此外，公司正通过 NVIDIA Quantum Direct 等平台积极布局量子计算领域，展现了其对未来计算技术的深远考量。在企业可持续性方面，英伟达的加速计算技术正助力全球数据中心的现代化改造，推动能效提升和成本节约，为实现可持续未来贡献力量。黄仁勋对于多样性和包容性的重视，也体现了公司文化对于创新和社会进步的积极影响。

二、革命性 AI 突破：谷歌 Gemini 2，性能与成本的双重优化！

谷歌公司于 6 月 28 日发布了第二代大语言模型 Gemini 2，这一模型以其 90 亿参数（9B）和 270 亿参数（27B）的两种配置，向全球研究人员和开发人员开放。Gemini 2 的架构经过重新设计，无论是 9B 还是 27B 版本，在同规模级别中均展现出最佳性能，甚至在某些方面超越了自身规模两倍的机型。这种性能与成本的双重优化，极大地降低了 AI 技术的部署门槛，使得预算更加合理。Gemini 2 还具备跨硬件快速推理的能力，用户可以在多种硬件上进行全精度运行，并通过 Google AI Studio 提升本地性能，或者利用 Hugging Face Transformers 在家庭电脑上进行测试。

特别引人注目的是，27B 模型在性能上可与规模大一倍的主流模型相媲美，而部署成本却因只需一片英伟达 H100 enSecCore GPU 或 TPU 主机而大幅降低。此外，9B 模型在性能上也超越了 Llama38B 等同规模开源模型。谷歌还计划推出 26 亿参数的模型，以满足智能手机 AI 应用的需求。

硅纪元视角 · Gemini 2 的推出预示着人工智能领域的一次重大变革。它不仅为研究人员和开发人员提供了更多的选择，也为 AI 技术的广泛应用铺平了道路。在性能与成本的双重优势下，Gemini 2 有望推动 AI 技术的进一步普及，加速智能化解决方案在各行各业的落地。同时，其跨硬件的快速推理能力，预示着 AI 技术将更加灵活地适应不同的应用场景和需求，为用户提供更加个性化和高效的服务体验。

三、OpenAI 打造 AI“监督员”CriticGPT，助力提升智能模型的准确性

OpenAI 开发了一款名为 CriticGPT 的新工具，旨在帮助识别大型语言模型中的“幻觉”，即错误生成的信息。CriticGPT 通过强化学习来自人类反馈（RLHF）技术，对 ChatGPT 生成的代码进行评估，发现错误。这项研究属于“对齐”工作，目标是使 AI 系统的目标与人类的目标一致。CriticGPT 在测试中表现亮眼，比人工代码审查者发现的错误多出许多，大约 85%的错误被 CriticGPT 捕捉到，而人工审查者只发现了 25%。尽管 CriticGPT 目前专注于代码审查，但其在未来可能被应用于更广泛的任务上。

硅纪元视角 · CriticGPT 的推出代表了 AI 自我监督和提升准确性的一大步。通过 AI 辅助的人工注释者，可以显著提高反馈过程的效率和质量。这种“可扩展的监督”方法，意味着即使 AI 系统在智力上超越人类，人类也能够持续对其进行监管。然而，这项技术也带来了新的挑战，例如可能增加人类参与的表面化风险，以及在反馈过程中潜在地引入 AI 偏见。尽管存在局限，CriticGPT 的实验结果和 OpenAI 在 AI 对齐研究上的持续努力，为构建更加可靠和符合人类价值观的 AI 系统提供了新思路和工具。

四、Oracle 引领 AI 数据库革命：HeatWave GenAI 重塑数据管理未来

Oracle 推出 HeatWave GenAI，将其大型语言模型和自动向量处理直接嵌入云数据库中，成为首个实现此功能的主流玩家。HeatWave GenAI 基于现有的 HeatWave 平台，通过新增的生成式 AI 功能，为企业提供更高效的性能、洞察生成和应用开发可能性。核心功能包括直接集成 LLMs 和自动化向量处理，简化了 AI 的部署和优化，允许企业专注于数据价值的提取。早期采用者的案例展示了在异常检测和电子商务推荐系统中的转型潜力。

硅纪元视角 · Oracle 的 HeatWave GenAI 标志着云数据库向智能化迈出的重要一步。通过将生成式 AI 直接融入数据库，Oracle 不仅民主化了 AI 技术的访问，而且为数据管理和分析带来了新的可能性。这种集成消除了 AI 采用的门槛，允许企业无需复杂配置即可利用 AI 解决实际问题。此外，HeatWave GenAI 的向量处理方法在保证准确性的同时提升了性能，为金融、医疗和科研等领域提供了可靠的数据处理方案。随着这种技术的普及，预计将出现更多智能应用，彻底改变企业对数据的价值提取和业务创新。

五、智能驾驶的“军备竞赛”：端到端大模型与车路云一体化

2024 年标志着中国智能驾驶领域的商用规模元年，特斯拉以 FSD 软件的升级引领了新一轮技术竞赛。特斯拉的 FSD 采取纯视觉方案，通过摄像头实现 360 度环视视野，摒弃了其他传感器，这一决策基于成本和“第一性原理”的考量。与此同时，中国车企则普遍采用激光雷达方案，利用多种传感器实现智能驾驶。

特斯拉的 FSD v12 版本通过端到端神经网络和数百万视频训练，取代了大量代码，显著提升了自动驾驶能力。中国车企在智能驾驶技术方面也不断进步，通过增加雷达装载量和降低成本，推动技术向低价车渗透。然而，端到端自动驾驶对数据和算力的需求巨大，对国内企业的技术迭代能力提出了更高要求。智能驾驶行业经历了从模块化架构到大模型的转变。模块化架构通过多个小模型处理不同任务，但随着自动驾驶需求的增长，这种架构逐渐无法满足城市自动驾驶的需要。大模型技术，如特斯拉的 BEV+Transformer 方案，通过融合时间和空间信息，实现更精准的感知。

硅纪元视角 · 智能驾驶领域的竞争不仅是技术层面的，还涉及到数据、算力和商业模式的创新。端到端大模型和车路云一体化虽然处于不同的发展阶段，但它们的目标一致——实现更安全、更智能的自动驾驶技术，为用户带来更好的驾乘体验。随着技术的不断进步和应用的拓展，智能驾驶的未来充满无限可能。