MMD_4a_CollaborativeFiltering

Overview

A tech for using one’s behavior to predict what other people will do.

history

之前,数据量很少的时候,人们一般search,但是当数据量很多,超市的货架上已经装不下的时候,这时候需要recommendation

long tail

这里写图片描述

X轴后面的商品不会出现在零售店中,因此需要去推荐购买。

types of rs

这里写图片描述

model

模型的关键在于utility matrix
这里写图片描述

key problems

推荐系统主要有三个核心问题:

  1. 搜集数据:可以显式地也可以隐式地搜集
  2. 根据数据推荐:主要解决sparse的问题
  3. 评估推荐模型的好坏

这里写图片描述

Content-based System

基于内容的推荐系统核心是:针对每一个user给很多item打了分。首先,建立item profile,比如电影的话要包含演员、年份、导演等特征。然后,根据用户的打分,将所有打过分的电影特征量聚合成一个新的user profile。最后,将每个电影的item profile和user profile对比,实施推荐方案。

main idea

Main idea: recommend items to customers x similar to previous items rated highly by x.

plan这里写图片描述

item profile

item profile是需要人工去指定的。

针对文本特征,可以使用TF-IDF(Term frequency * Inverse Doc Frequency)。
这里写图片描述

user profile

user profile是根据一定的策略,从item profile中聚合而来。
这里写图片描述

prediction

这里写图片描述

pros and cons

这里写图片描述

Collaborative Filtering

main idea

比如想要给x推荐电影,可以采用两种方法:

  1. user-user: 根据x对电影的评分,找出和x最像的人群集合S,然后用集合S的数据给x未评分的电影打分。
  2. item-item: 根据x未评分的电影m,找出x已经评过的并且和m很相似的电影S,利用S来打分。

这里写图片描述

similar user

这里写图片描述

rating prediction

这里写图片描述

item-item filtering

这里写图片描述
这里写图片描述

item vs. user

一般来说,item-item表现更好。
这里写图片描述

implement

complexity

这里写图片描述

pros and cons

这里写图片描述

hybrid methods

这里写图片描述

global baseline and CF

这里写图片描述

Evaluating

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值