pytorch resnet50预训练模型_请谨慎使用预训练的深度学习模型

最新推荐文章于 2024-05-29 14:34:58 发布

weixin_39787606

最新推荐文章于 2024-05-29 14:34:58 发布

阅读量1.1w

点赞数 5

文章标签： pytorch resnet50预训练模型 resnet预训练模型为什么训练时测试准确率大幅度波动屏蔽预训练模型的权重。只训练最后一层的全连接的权重。怎样判断keras模型是否使用了tpu 机器学习训练好的模型的使用

编辑：zero
关注搜罗最好玩的计算机视觉论文和应用，AI算法与图像处理 微信公众号，获得第一手计算机视觉相关信息
本文转载自：公众号：AI公园

作者：Cecelia Shao

编译：ronghuaiyang

导读

预训练模型用起来非常容易，但是你是否忽略了可能影响模型性能的细节呢?

import torchvision.models as models
inception = models.inception_v3(pretrained=True)

或者是这个

from keras.applications.inception_v3 import InceptionV3
base_model = InceptionV3(weights='imagenet', include_top=False)

看起来使用这些预训练的模型已经成为行业最佳实践的新标准。毕竟，有一个经过大量数据和计算训练的模型，你为什么不利用呢？

利用预训练的模型有几个重要的好处：

NLP领域的进步也鼓励使用预训练的语言模型，如GPT和GPT-2、AllenNLP的ELMo、谷歌的BERT、Sebastian Ruder和Jeremy Howard的ULMFiT。

利用预训练模型的一种常见技术是特征提取，在此过程中检索由预训练模型生成的中间表示，并将这些表示用作新模型的输入。通常假定这些最终的全连接层得到的是信息与解决新任务相关的。

每一个主流框架，如Tensorflow，

关注