数据挖掘算法手记

1)item base

a)每个用户所关注的所有书,根据对每一本书行为打分(订阅、浏览、点击等行为加权总分),选出分值最高的5本书(即先定位用户最关注的5本书)

b)每一本书计算最相近的3本书作为推荐,最终给每个用户推荐5*3 本书

c)item1。。。。。itemtn

d)根据item1,如何确定推荐哪3本?

e)item1 和 item2 算相关性(将同时看过item1和item2的用户打分相乘,然后将所有user的分值相加,计算总分),然后item1再和itemn计算总分,最终分值排名取前3即

f)解决长尾,解决新用户


2)user base

a) 圈子的社会化行为,马太效应

b) 适合引入新item,可以很快扩散,解决new item冷启动问题


3)content base


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值