每日论文231103: once for all

最新推荐文章于 2024-07-18 15:53:23 发布

Undefined游侠

最新推荐文章于 2024-07-18 15:53:23 发布

阅读量29

点赞数

分类专栏：论文阅读文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19859865/article/details/134194966

版权

论文阅读专栏收录该内容

9 篇文章 0 订阅

订阅专栏

视频链接: https://www.youtube.com/watch?v=wrsid5tvuSM

项目链接: https://github.com/mit-han-lab/once-for-all

论文链接: https://arxiv.org/pdf/1908.09791.pdf

该项目吸引到我的是,它在效率和精度上实现的非常好的效果, 配合efficientML的Lecture也是很香.

此外, 提供的视频链接介绍了ofa的使用方式.

__________________________________________________________

初读

在介绍部分，作者提到，它是通过解耦合训练和搜索的方式来支持广泛的架构搜索。此外，为了有效的训练，通过一种广义的剪枝的方法，去从多维度减小模型大小。然后，OFA效果要明显好于目前的NAS方法。

在总结阶段中，作者提到，通过，OFA不需要基于不同平台采用不同架构，而是可以在一次训练后，适配所有架构，包括深度，宽度，kernel大小和分辨率。此外，还提出了一种progressive shrinking的算法。

读完之后，问题还是很多的，progressive shrinking就是一个让人很好奇的概念。

直接做实验吧，实验记录在这

EfficientAI Lab3: Neural Architecture Seach-CSDN博客

——————————————————————————————————

细读

Progressive shrinking 是用于提供OFA模型的训练效率。首先训练一个最大的网络，然后再慢慢缩小网络的深度，宽度和kernel size。

OFA在imagenet上的效果很惊艳。

传统模型部署都是基于特定模型，然后优化结构。而OFA则使用了一个巨大的搜索空间，带来超强的灵活性，但是也给训练带来更大的挑战，因此我们使用Progressive shrinking的方法来试图解决。

Architecture space

搜索空间中对于图像大小，kernel大小等因素都可以调整，并且所有subnets共享相同的参数。

这张图例里很清楚的说明了，PS相比于Pruning，只是维度更多。在实际训练时，基于大模型训练小模型，然后采用知识蒸馏的方法进行进一步调优。

作者列举了缩小kernel size， channel size的策略，还是有细节在里面的。比如小kernel要考虑到它既是大kernel的一部分，但同时也承担了一定的责任。

Specifically, we randomly sample 16K sub-networks with different architectures and input image sizes, then measure their accuracy on 10K validation images sampled from the original training set. These [architecture, accuracy] pairs are used to train an accuracy predictor to predict the accuracy of a model given its architecture and input image size

上面这部分是我完成lab时候，印象最深的一部分，那就是，我构建了一个简单的FCN，用来评估不同架构的模型精度。

实验

在实验中，作者提到基于MobileNetV3 作为architecture space进行搜索。（其实这里，我的问题是为什么不使用MCUNet？）

作者这里的性能对比，包含intel CPU提供的MKL-DNN，手机和TF-Lite，IoT设备使用Pytorch 1.0+cuDNN。实验结果是基于imagenet完爆mobilenet。。。

感受

这篇论文，因为它的实验结果很好，当然是值得细读。梳理一下它所提出的策略，感觉像一套组合拳，这套组合拳里，哪些是关键点，哪些优点累赘呢？这还需要进一步的分析判断。而在实际使用中，这个框架究竟有怎样的效果，还是需要进一步的分析和实验。

Undefined游侠

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
每日论文231103: once for all

视频链接:项目链接:论文链接:该项目吸引到我的是,它在效率和精度上实现的非常好的效果, 配合efficientML的Lecture也是很香.此外, 提供的视频链接介绍了ofa的使用方式.
复制链接

扫一扫

专栏目录

Undefined游侠 CSDN认证博客专家 CSDN认证企业博客

码龄10年

55: 原创

9万+: 周排名

3万+: 总排名

1万+: 访问

: 等级

847: 积分

215: 粉丝

294: 获赞

4: 评论

270: 收藏

私信

关注

热门文章

分类专栏

最新评论

EfficientAI Lab：大模型AWQ量化
cooper6666: 咨询一下，为什么现在awq只支持Int4量化，而不支持int3或者int8量化呢？
EfficientAI Lab：大模型AWQ量化
askcs517: 如何评估模型的perplexity值呢？具体方法和代码实现可以分享下吗？
EfficientAI Lab：大模型AWQ量化
小飞侠的日常学习: autoawq在公式3中，需要对s^-1 * x，但是看代码实现，没有找到这个乘法操作，作者给出的注释是# NOTE: s^-1 * x is fused here, according to paper，请问您知道这里为啥么
YOLO系列论文阅读（v1--v3）
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。