推荐系统之BRP

本文详细介绍了在推荐系统中使用BRP方法处理数据的过程,包括加载和清洗交互数据,删除无效记录,重置索引,处理缺失值以及正则化数值。此外,还探讨了如何根据不同的策略将数据划分为训练集、验证集和测试集,如随机排序、时间顺序和按比例分割等,并提到pairwise思想在模型训练中的应用。
摘要由CSDN通过智能技术生成

1: 通过import_module函数获取数据集

dataset_module = importlib.import_module('rec.data.dataset')

请添加图片描述
2:加载数据

 self._load_data(self.dataset_name, self.dataset_path)

首先加载交互功能数据。

self._load_inter_feat(token, dataset_path)

将数据集名称和数据集拼接在一起。

 inter_feat_path = os.path.join(dataset_path, f'{
     token}.inter')

请添加图片描述

请添加图片描述
在inter数据集合中的数据形式:
请添加图片描述
用pandas 读取数据

 inter_feat = self._load_feat(inter_feat_path, FeatureSource.INTERACTION)
with open(filepath, 'r') as f: #读数据真正的开始
  head 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值