世界数字技术院发布大模型安全国际标准,蚂蚁集团、OpenAI、科大讯飞等参编...

4 月 15-19 日,第 27 届联合国科技大会在瑞士日内瓦召开。其间,世界数字技术院(WDTA)于 4 月 16 日发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。

45abf3f3d4098e46ac7944d32bfc5cd6.jpeg

据中国经济网报道,这两项国际标准为大模型及生成式 AI 应用方面的安全测试标准,代表着全球人工智能安全评估和测试进入新的基准。

这两项标准由 OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成,其中《大语言模型安全测试方法》由蚂蚁集团牵头编制。

0e5e320cd929ab37849f090993aaeb50.png

《标准》为测试、验证生成式 AI 应用(尤其是使用大语言模型构建的应用程序)的安全性提供框架,定义了 AI 应用程序架构每层测试验证范围,包括不限于如下方面。

  • 基础模型选择

  • 嵌入和矢量数据库

  • RAG 或检索增强生成

  • AI 应用运行时的安全

《方法》则为大模型本身安全性评估提供了“全面、严谨且实操性强”的结构性方案,提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法。据报道,《方法》可以解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力,使开发人员和组织能够识别和缓解潜在漏洞,并最终提高使用大语言模型构建的人工智能系统的安全性和可靠性。

WDTA 系国际非政府组织,于日内瓦注册。该机构遵从联合国指导框架,致力于在全球范围内推进数字技术,促进国际合作。AI STR(安全、可信、负责任)计划是 WDTA 的核心倡议,旨在确保人工智能系统的安全性、可信性和责任性。

此次大会还吸引了诺贝尔获奖者、图灵奖获得者、多个国家工程院院士以及众多科技企业代表参加。与会人员围绕人工智能的安全信任、数据跨境流通、数字人才教育等话题展开了深入的讨论。世界数字技术院人工智能安全可信负责任工作组组长黄连金表示,随着人工智能系统,特别是大语言模型在社会各领域的广泛应用,制定全面的标准来解决它们的安全挑战变得至关重要。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值