隐语实训-12基于隐语的ViT

最新推荐文章于 2024-10-25 11:59:44 发布

人生相聚两依依

最新推荐文章于 2024-10-25 11:59:44 发布

阅读量663

点赞数 10

分类专栏：隐私计算文章标签：可信计算技术人工智能

本文链接：https://blog.csdn.net/sunxi1900/article/details/140089406

版权

12 篇文章 1 订阅

订阅专栏

1.1 引言

隐私保护需求：随着隐私保护的重要性日益增加，MPC（安全多方计算）成为实现隐私保护计算的关键技术。在视觉任务中，Transformer模型（如ViT）因其强大的表现力和灵活性受到广泛关注。
研究动机：ViT模型在MPC环境下的计算延迟和通信成本较高，尤其是在多头注意力机制和MLP块的GeLU激活函数方面。

1.2 MPC下的ViT隐私推理框架

1.3 ViT模型架构

ViT架构：基于Transformer的编码器架构，包括输入嵌入层、多个Transformer块和分类层。每个Transformer块包含多头注意力层和MLP块，MLP块包含两个线性层和一个GeLU激活函数。

1.4 研究动机

2.1 搜索空间设计

粒度划分：设计了三种不同粒度的搜索空间：
- 粗粒度：Transformer层级粒度。
- 中粒度：注意力头级粒度。
- 细粒度：注意力行级粒度（token级）。

2.2 算法步骤

3.1 SecretFlow架构

在这里插入图片描述

3.2 搭建流程

ViT模型组件：
- Patch Embedding：使用卷积实现图像Patch嵌入。
- 注意力机制：构建多头注意力层。
- MLP模块：通常设置较小架构，GeLU激活函数的维度较大。
- Transformer模块：完整的Transformer层构建。

3.3 ViT模型隐私推理

4.1 实验对比

与相关工作的对比：在不同数据集上，与Linformer、THE-X和MPCFormer等基线模型相比，MPCViT在延迟和准确率方面均有显著提升。
- CIFAR-10、CIFAR-100、Tiny-ImageNet：在Tiny-ImageNet数据集上，MPCViT比基线模型在延迟方面降低了6.2×、2.9×和1.9×，准确率提高了1.9%、1.3%和3.6%。

4.2 消融实验