一个用ranknet优化排序模型的demo

最新推荐文章于 2024-04-23 08:33:56 发布

jp_666

最新推荐文章于 2024-04-23 08:33:56 发布

阅读量103

点赞数

文章标签：深度学习 pytorch python 排序算法

本文链接：https://blog.csdn.net/jp_666/article/details/132765047

版权

一个用ranknet优化排序模型的demo

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset

class RankNetDataset(Dataset):
    def __init__(self, features, labels):
        self.features = features
        self.labels = labels
        
    def __len__(self):
        return len(self.features)
    
    def __getitem__(self, idx):
        feature = self.features[idx]
        label = self.labels[idx]
        return feature, label

class RankNetModel(nn.Module):
    def __init__(self, input_size, hidden_size):
        super(RankNetModel, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_size, 1)
        
    def forward(self, x):
        out = self.fc1(x)
        out = self.relu(out)
        out = self.fc2(out)
        return out

def ranknet_loss(output1, output2, target):
    sigmoid = nn.Sigmoid()
    prob1 = sigmoid(output1 - output2)
    prob2 = 1 - prob1
    loss = -torch.mean(target * torch.log(prob1) + (1 - target) * torch.log(prob2))
    return loss

# 示例输入数据
features = torch.tensor([[0.2, 0.1], [0.5, 0.3], [0.4, 0.2], [0.8, 0.7]])
labels = torch.tensor([1, 0, 1, 0])

# 超参数
batch_size = 2
input_size = features.shape[1]
hidden_size = 16
learning_rate = 0.01
num_epochs = 10

# 创建数据集和数据加载器
dataset = RankNetDataset(features, labels)
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

# 初始化模型和优化器
model = RankNetModel(input_size, hidden_size)
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型
model.train()

for epoch in range(num_epochs):
    total_loss = 0
    
    for feature, label in dataloader:
        optimizer.zero_grad()
        
        output = model(feature)
        loss = ranknet_loss(output[0], output[1], label.float())
        
        loss.backward()
        optimizer.step()
        
        total_loss += loss.item()
    
    average_loss = total_loss / len(dataloader)
    print(f"Epoch {epoch+1}/{num_epochs}, RankNet Loss: {average_loss}")

# 在测试集上评估模型
model.eval()

test_features = torch.tensor([[0.3, 0.4], [0.7, 0.5]])
test_labels = torch.tensor([1, 0])

test_dataset = RankNetDataset(test_features, test_labels)
test_dataloader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

for feature, label in test_dataloader:
    output = model(feature)
    predicted_labels = torch.round(torch.sigmoid(output)).flatten().tolist()
    
    print("Predicted Labels:")
    print(predicted_labels)