排序部分总结
rank模型是对不同的item打分,然后item根据不同的得分展现给用户
特征和样本量的比例一般是1:100及其以上,即样本量要保证。实验中的样本量太少,所以wd没有发挥出威力。如果比例低于100,过拟合的风险就很大。
user:用户静态属性,如年龄、性别、地域以及简单的统计特征(比如用户买过多少商品、长短时统计比如近30天。。。blabla)、还有根据用户历史给他打上一些标签,比如
item:商品的特征,比如商品名称、上线日期、被购买的次数、深受哪些人欢迎等等
context:上下文特征,当前星期几,用户请求服务时地理位置信息等
ui relation:用户和item的关系,比如用户买过它、加入过购物blabla
statistic supplement:统计增补信息,比如商品上架时间和购买率之间的关系、近一个月上架商品的购买率、近两个月上架商品的购买率
个性化推荐召回和排序的总结
用户访问时,通过recall得出这个用户的候选集列表,再通过feature assemble去kv中去拼一下特征,获得用户侧的特征和item侧的特征以及上下文特征等等,然后rank server会得出每个item的得分,返回给推荐引擎。