用 PyTorch 框架加载预训练模型并进行预测的过程包括以下几个步骤:加载模型、进行图像预处理、进行前向传播以及处理预测结果。以下是一个完整的示例,展示了如何使用预训练的 ResNet50 模型在一张图像上进行预测。
import torch
from torchvision import models, transforms
from PIL import Image
import requests
# 加载预训练的 ResNet50 模型
model = models.resnet50(pretrained=True)
# 将模型设置为评估模式(在训练模型时,某些层(如 Dropout
和 BatchNorm
)的行为会有所不同,以便提高模型的泛化能力和稳定性。但是在评估或测试模型时,我们希望模型的行为是确定的、可重复的,因此需要将模型切换到评估模式。)
model.eval()
# 定义图像预处理步骤
preprocess = transforms.Compose([
transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor(),
transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])
# 加载图像并进行预处理
img_url = "https://example.com/path/to/your/image.jpg" # 替换为实际图像URL
response = requests.get(img_url, stream=True)
img = Image.open(response.raw)
img_t = preprocess(img)
batch_t = torch.unsqueeze(img_t, 0)
# 关闭梯度计算
with torch.no_grad():
# 前向传播
out = model(batch_t)
# 处理预测结果
_, indices = torch.sort(out, descending=True)
percentage = torch.nn.functional.softmax(out, dim=1)[0] * 100
# 打印前五个预测结果
for idx in indices[0][:5]:
print(f"Index: {idx}, Percentage: {percentage[idx].item():.2f}%")