【大模型&隐私计算】如何用隐私计算技术保护大模型

1.  背景介绍

        最近关注到上海科委发布了2024关键技术攻关专项的指南通知【1】,其中涉及到一个非常有意思的课题:《大模型隐私保护技术研究》。

       课题提到:

研究目标:针对大模型参数与训练数据等资产隐私保护的需求,构建大模型关键参数识别、筛选及隐私保护算法框架。

研究内容:研发大模型隐私保护算法框架及实施方案,对于拥有不超过130亿参数量级的模型,算法工具能够在2小时内筛选出模型中最具保护价值的参数并给出推荐模型参数保护数量(不超过模型参数总量的10%),实现针对千万级词元数据集SFT攻击还原训练数据的有效防护,并在类SQL语言生成应用场景进行验证。

        该课题中谈到,算法工具能够筛选出最具保护价值的参数以及数量,这个思路很新颖,设计一种有效的算法自动去识别出信息量大或者信息敏感的关键参数模块。前期其实调研了一番隐私计算技术如何应用于大模型的隐私保护:包括采用横向/纵向联邦学习、TEE及模型切片、端云协同、差分隐私、提示工程保护、隐私微调、多方安全计算实现加密推理等不同的技术路线,但确实没有看到课题所提出的这样一种技术。

        看到这个,回忆起很早之前接触的复杂网络,更具体是指网络中的关键节点识别,通过一系列网络分析,能够识别出能够引起网络崩塌或者网络失效的关键节点。假如说将大模型的神经元看成是一系列连接的节点,是否也可以使用复杂网络的方法来实现关键节点或者参数的识别? 感觉会是很有趣的一个探索方向。

        如果读者有相关的其他想法,欢迎留言讨论。

        本文后续会将之前调研的隐私计算实现大模型隐私保护的技术做进一步补充和完善,也期待过程中对上海科委的课题有进一步的新想法。

2. 参考材料

【1】关于发布上海市2024年度区块链关键技术攻关专项项目指南的通知

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

源泉的小广场

感谢大佬的支持和鼓励!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值