1、用户调研:
新用户:兴趣未知,着重多样性
对策:注册时尽量让用户填写人口统计学数据;让用户自己填写选择标签。
老用户:兴趣已知,着重个性化
2、推荐需要根据类别来
内容推荐以用户兴趣为主
电商推荐以价格、品牌为主
购买频率较少的类别:房、车、装修以专家推荐和互补推荐为主
3、推荐在哪里展示
个性化首页、商品详情页面、用户个人页面、购物车页面、评论区页面
4、用户行为的设计
有喜欢、反对、星级打分(十分还是五分)、收藏、评论等行为可供用户。这部分需要考虑用户体验,如何提高用户反馈率。
5、系统评测
用户点击率、转换率、单次使用时长、重复使用率、也可以将用户分成a和b组分别用不同的推荐系统,然后对比。
1、数据的获取
2、特征工程:平滑化、归一化、异常值和缺失值的处理
3、算法和模型的选择
4、预测、A/B测试、调优
推荐系统在技术实现上一般划分为三个阶段:挖掘、召回、排序。
1、挖掘的工作就是对用户和物品做非常深入的结构化分析,各个角度各个层面的特征都被呈现出来,并且建好索引,供召回阶段供召回阶段使用,大部分挖掘工作都是离线进行的。
2、接下来就是召回,为什么会有召回?因为物品太多了,每次给一个用户计算推荐结果时,如果对全部物品挨个计算,那将是一场灾难,取而代之的是用一些手段从全量的物品中筛选出一部分比较靠谱的。召回集可以从多种模型中得到汇总。但是有个问题:每种算法给出结果时如果有分数,分数的范围不一定一样,所以不能互相比较,大家各自家庭背景不一样;即使强行把所有分数都归一化,仍然不能互相比较,因为产生的机制不同,有的可能普遍偏高,有的可能普遍偏低。所以需要进行排序。
3、最后就是排序,针对筛选出的一部分靠谱的做一个统一的论资排辈,最后这个统一的排序就是今天要讲的主题:融合。