推荐系统中,主流的特征工程方法。
用户特征:
·基本信息:用户的年龄、性别、地理位置等基本信息
·行为信息: 用户的点击历史、购买历史、收藏历史等行为信息。
·社交信息: 用户在社交网络上的关系、好友列表等信息。
物品特征:
·基本信息:物品的类别、标签、发布时间等基本信息。
·内容信息:对于文本内容,可以提取关键词、主题等信息,
·图片信息:对于图像内容,可以使用图像特征提取方法获取特征。
上下文特征:
·时间信息:用户行为的时间信息,如小时、星期、季节等。
·环境信息: 用户行为发生的环境,比如设备类型、网络状态等。
交叉特征:
·用户-物品交叉信息: 用户和物品之间的交互信息,如用户购买历史与物品类别的交叉。
·用户-上下文交叉信息: 考虑用户行为发生的时间和地点对推荐的影响。
Embedding 特征:
·用户 Embedding:使用技术如Word2Vec、ltem2Vec等将用户表示为低维向量
·物品 Embedding:类似地,将物品表示为低维向量。
统计特征:
·用户行为次数: 统计用户对物品的点击次数、购买次数等。
·物品流行度: 物品被点击、购买的次数,用于反映物品的热门程度。