1:BPR推荐
用到inter数据文件。
[‘user_id’, ‘item_id’, ‘rating’, ‘timestamp’]
首先将数据self.shuffle()随机打乱。根据User的ID将数据聚合在一起。一个聚合了943个用户list。这每个list里面包含用户所购买的商品信息。对于每个list我们按照8:1:1的比例分割成train_data, valid_data ,test_data。
def _grouped_index(self, group_by_list):
index = {
}
for i, key in enumerate(group_by_list):
if key not in index:
index[key] = [i]
else:
index[key].append(i)
return index.values()
#实现了将item聚合到不同的list。
2:xDeepFM推荐
用到inter数据文件,item数据文件, user数据文件。
[‘user_id’, ‘item_id’, ‘timestamp’, ‘age’, ‘gender’, ‘occupation’, ‘release_year’, ‘class’, ‘label’]
label标签的值根据设置的阈值来确定。
首先将数据self.shuffle()随机打乱。根据User的ID将数据聚合在一起。一个聚合了943个用户list。这每个list里面包含用户所购买的商品信息。对于每个list我们按照8:1:1的比例分割成train_data, valid_data ,test_data。
def _grouped_index(self, group_by_list):
index = {