web数据挖掘之推荐系统

该篇文章介绍在推荐系统中

基于用户行为的个性化推荐算法,行业里叫协同过滤,顾名思义,协同指的是用户和网站之间的互动,可以理解为用户在网站上的行为,被网站记录下来,形成日志,网站又会基于该日志使用相应的推荐算法,给用户推荐用户可能感兴趣的something。
以上提到的日志就是用户行为数据,此处切入正题。
一.如何利用用户的行为数据
用户行为分为两种——显性反馈行为和隐性反馈行为。
显性反馈行为,比如说:用户对一个电影的打分
隐形反馈行为,比如说:用户浏览了一个商品的网页,但是你又不能判断用户是不是真的喜欢这个商品,可能是用户喜欢这个商品就点击进入这个网页,可能是该商品的位置在网页的顶端,用户喜欢点击顶部的网页,于是就浏览这个商品的网页,所以不能断定用户是不是真的喜欢该商品。
这两种行为又各自有正负反馈,分别代表喜欢或者不喜欢
用户的行为数据常用的有四种而该文章中则使用其中之一的无上下文信息的隐形反馈数据作为用户的行为数据。
二.用户行为分析
1,用户活跃度和物品流行度的分布服从幂律分布或称之为长尾分布
公式
2.用户的活跃度跟商品的流行度成反比。
三.实验设计和算法测评
实验数据划分为两份一份训练数据,一份测试数据。有时亦可分三份,根据情况划分比列
测评推荐算法的精度两个指标,recall,以及precision。
另外还有计算算法覆盖率的公式,算法的覆盖率指的是把长尾分布中长尾推荐给用户的能力。
推荐物品的新颖度,用物品的平均流行度进行度量。推荐的物品很流行的话,那么就缺少新颖度,反之亦然。
四.还是纸质版的笔记得人心啊。。。该博客到此

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值