在上一篇博客https://blog.csdn.net/weixin_45459911/article/details/106148695中,对比赛进行了基本的介绍并提供了一个baseline,今天就来详细介绍一下比赛数据。
数据查看
1、查看…/data/underexpose_train/underexpose_user_feat.csv数据(分别是用户id、年龄水平、用户性别、城市等级):
2、查看…/data/underexpose_train/underexpose_item_feat.csv数据:
由以下部分组成:
item_id:商品的唯一标识符
txt_vec:项目的文本特征,它是由预先训练的模型生成的128维实值向量
img_vec:项目的图像特征,它是由预先训练的模型生成的128维实值向量
3、查看…/data/underexpose_train/underexpose_train_click-0.csv数据
分别为:用户id,item_id,点击时间(数据已脱敏)。
4、查看…/data/underexpose_test/underexpose_test_click-0/underexpose_test_click-0.csv数据
5、查看…/data/underexpose_test/underexpose_test_click-0/underexpose_test_qtime-0.csv数据