3DCNN-Based Knowledge Distillation Framework for Human Activity Recognition

盖盖的博客

于 2024-01-12 13:50:51 发布

阅读量993

点赞数 19

分类专栏：论文相关文章标签： cnn 人工智能神经网络知识蒸馏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45662626/article/details/134770572

版权

A 3DCNN-Based Knowledge Distillation Framework for Human Activity Recognition

Abstract:
1. Introduction
2. The Proposed Spatio-Temporal Knowledge Distillation Framework
3. Experimental Results and Discussion

Abstract:

本文提出了一个知识蒸馏框架，该框架使用离线知识蒸馏技术从大型教师模型中提取时空知识到轻量级学生模型。

所提出的离线知识蒸馏框架采用两个模型：大型预训练 3DCNN（三维卷积神经网络）教师模型和轻量级 3DCNN 学生模型（即教师模型在同一数据集上进行预训练，学生模型要训练）。

在离线知识蒸馏训练过程中，蒸馏算法只训练学生模型，帮助学生模型达到与教师模型相同的预测精度水平。

短推理时间和高精度使得我们提出的框架适用于实时应用中的人类活动识别。

1. Introduction

知识蒸馏方法是自我监督学习的一种特殊变体，它提供了模型压缩和知识转移。范式知识蒸馏由两个网络架构组成，即教师和学生，其中学生在训练期间通过最小化称为蒸馏损失的相互损失来学习。

基于特征的知识蒸馏通过最小化教师和学生模型之间的特征级差异，将特征表示级别的知识从教师转移到学生模型。

本文提出了一个3D卷积神经网络(3DCNN)驱动的知识蒸馏框架，该框架由两个3DCNN网络组成，即3DCNN教师和3DCNN学生。为了有效地进行知识转移，提出了一种离线知识蒸馏策略。

2. The Proposed Spatio-Temporal Knowledge Distillation Framework

所提出的时空知识蒸馏框架基于三个主要组件，包括师生 3DCNN 架构、离线知识蒸馏范式和时空知识蒸馏过程的工作流程。

所提出框架的第一个核心组件是一对师生 3DCNN 网络&

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。