NeurIPS 2024大模型隐私挑战赛落幕,中国团队夺得赛道冠军

近日,第三十八届神经信息处理系统年会(NeurIPS 2024)特设官方赛——大语言模型隐私挑战赛(LLM-PC)落幕。蚂蚁数科旗下摩斯联合浙江大学计算机体系结构实验室陈文智、魏成坤团队共9人组成了“Morse & ARCLab”参赛队伍,荣获该赛事全部两个赛道中攻击赛道的冠军和防御赛道的最佳实用防御奖。赛题聚焦大语言模型训练数据的隐私安全,有助于推动整个领域向构建更加安全、可靠的AI系统目标前进,冠军方案也代表着当前业界领先技术。

NeurIPS是机器学习领域三大顶级国际会议之一,也是中国计算机学会A类推荐会议。本次特设竞赛于2024年7月底开始,由加州大学伯克利分校、德州大学奥斯汀分校、伊利诺伊大学厄巴纳-香槟分校、新加坡国立大学、Center for AI Safety等高校与机构联合命题组织,吸引来自数十个国家超30支队伍参与角逐。

本次参赛者的任务是设计与实现创新解决方案,从下游模型中窃取训练数据中的隐私或设计隐私保护的训练方法。据悉,此次攻击赛道中,蚂蚁数科和浙大团队方法在比赛提供的Llama3.1-8B模型上可以达到0.233的攻击成功率;在防御赛道,其方案使主办方提供的攻击方法成功率相对降低30.6%,同时在MMLU和TruthfulQA等基准数据集上的结果也表明该方法对模型性能几乎没有损耗。

参赛队伍队长蚂蚁数科摩斯算法专家刘文炎告诉记者:“在攻击赛道中,我们通过查询目标模型来构建提示语,促使其为每个掩盖的个人可识别信息(PII)生成候选回应,并计算其损失值,再用自我提示候选提取和基于损失的贪心搜索,选择损失值最低的候选作为最终输出。这种基于分段与聚合的损失计算方法,以加速候选项的选择过程。在防御赛道中,我们利用数据脱敏与合成技术,对包含PII的语料进行随机替换,之后以自回归的方式微调目标模型,可以扰乱大模型对PII信息的记忆,降低其输出正确PII的可能,防止隐私数据泄漏。”

解决数据和模型的隐私安全问题,是大模型在产业界尤其是金融行业落地的重要课题。蚂蚁数科摩斯结合比赛同款方案,研发了大模型隐私保护产品,该产品融合数据脱敏、拆分学习、模型混淆、差分隐私、TEE等多种技术路线,实现大模型应用中模型微调、推理全链路的数据和模型隐私保护。目前该方案应用于网商银行农业助贷场景,利用摩斯的大模型隐私保护技术融合多方时空大数据,共建“密态时空大模型”,进行行内农户贷款风险评估,进一步提升种植户金融放宽效率和满意度。

今年7月,蚂蚁数科摩斯成为信通院首批通过大模型可信执行环境产品专项测试的厂商。蚂蚁数科摩斯技术负责人殷山表示,“摩斯将在大模型隐私保护方向,持续进行技术投入和落地探索,推进大模型在产业界发展。”

### 关于2024年团体程序设计天梯赛的关键信息 #### 官方网站 官方尚未公布特定针对2024年的独立网址,但通常情况下,比赛的相关信息会发布在全国高等学校计算机教育研究会的官方网站以及Pintia平台(拼题A网站)上。建议定期访问这两个站点获取最新动态[^1]。 #### 报名时间 第九届“中国高校计算机大赛—团体程序设计天梯赛”的报名通道已于2023年11月20日正式开放,并将持续至2024年3月24日结束。在此期间,各参赛队伍可以通过网络完成必要的注册手续并提交所需资料。 #### 比赛规则概览 虽然具体的细则可能随每一年度有所不同,但从以往的经验来看,比赛大致遵循以下模式: - **网上报名**:参与者需按时在网上填写个人基本信息及相关证明文件来完成初步登记。 - **初赛**:所有成功注册并通过审核后的成员将在规定日期参与线上测试环节;此阶段重点检验选手的基础编程技巧与算法应用水平。 - **复赛**:对于那些顺利晋级第二轮的人来说,则要迎接更具挑战性的线下考核项目——不仅考验技术实力更注重创新能力的表现。 - **决赛**:最终入围者还需面对更为复杂的任务情境,在这里除了专业知识外还需要展现出良好的团队合作精神和其他综合素养。 - **颁奖典礼**:当全部赛事圆满落幕之后,主办方将择期举行庆祝仪式向优胜者颁发荣誉证书及其他形式的认可奖项[^2]。 值得注意的是,尽管上述描述提供了基本框架指导,实际操作中的细节安排仍以当年官方发布的正式指南为准。因此强烈推荐密切关注来自组织方的通知更新以便掌握最准确的比赛流程说明。 ```python # 示例代码用于展示如何查询当前日期是否处于可报名时间段内 from datetime import date start_date = date(2023, 11, 20) end_date = date(2024, 3, 24) def is_within_registration_period(current_date=date.today()): return start_date <= current_date <= end_date print(f"Current registration status: {'Open' if is_within_registration_period() else 'Closed'}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CSDN资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值