- 博客(2)
- 收藏
- 关注
原创 [spark]计算商品相似度
一、商品相似度定义 基于物品的协同过滤算法是业界应用最多的算法,它的思想是给用户推荐那些和他们喜欢的物品相似的物品,主要分为两个步骤:一,计算物品之间的相似度;二,根据物品相似度和用户的历史行为给用户生成推荐列表。物品i和物品j的相似度可定义为:其中,分母是喜欢物品i的用户数,分子是同时喜欢物品i和物品j的用户数。 在电商网站中,用户前后的消费行为有很强的关联性,如上图所示,两个用户...
2018-07-12 19:19:37 8822
原创 [数据挖掘案例]逻辑回归LR模型实现电商商品个性化推荐
目录 一、问题描述二、数据摸底三、数据清洗和特征筛选3.1 数据抽取和清洗3.2 特征筛选:决策树3.3 特征分布转换3.4 特征共线性检查四、模型搭建4.1 数据集4.2 模型训练4.3 模型验证五、模型上线效果跟踪一、问题描述 在电商平台中,有海量的商品,如何为用户挖掘出感兴趣的商品,真正实现千人千面具有重要的意义。商品得分...
2018-07-04 18:00:16 5281 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人