「AI Drive」是由 biendata 和 PaperWeekly 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。
本期 AI Drive,我们邀请到清华大学四年级在读博士生-李一鸣,为大家在线解读其发表在 AAAI 2022的最新研究成果:通过验证嵌入的外源特征防止模型窃取。对本期主题感兴趣的小伙伴,3 月 17 日(周四)晚 7 点,我们准时相约 AI_Drive B 站直播间。
一、直播信息
演讲摘要:
模型偷盗攻击试图逆向出一个和被部署的受害者模型具有相似功能的替代模型。训练一个具有良好表现的模型费时费力,因此模型偷盗会对模型所有者带来巨额损失,造成巨大威胁。在本次报告中,我们将从所有权验证的角度讨论如何防御模型偷盗攻击。具体的,我们从原理上揭示了现有方法的缺陷,并提出了一种通过验证嵌入外源特征的防御方法。该方法在保证模型精度的同时,能成功验证模型偷盗攻击的存在,且不会引入新的安全威胁。
论文名称:
Defending against Model Stealing via Verifying Embedded External Features
论文链接&#x