tag推荐系统的关键问题以及解决方案

本文探讨了tag推荐系统的产品形态,包括基于tag的item推荐和tag推荐。关键问题在于tag的来源,包括专家标注、UGC、系统产生和人工与系统结合。在解决tag产生后,通过构建tag体系并抽取特征进行推荐。tag推荐涉及用户对item的喜好度计算,可采用tf-idf或其他概率模型。同时,文章提出推荐用户常用和item上常见的tag以提升用户体验。
摘要由CSDN通过智能技术生成
 
from: http://www.hxxiaopei.com/?p=141
最近在做推荐产品,读了一些论文,客观的说,扯淡的居多,基本的思路也差不多,结合工作的情况,谈一下tag推荐的产品形态、主要问题以及如何推荐

产品形态以及主要问题

tag 的推荐系统,顾名思义,利用用户或者item的 tag信息进行推荐,涉及到两个产品形态:

1.tag-based recommend,基于tag信息推荐item给用户

2.tag recommend,给用户推荐tag

无论1,还是2,都面临一个问题,tag从哪里来?这个是tag推荐系统最为关键的事情。通常来讲,有4个:

1.专家标注,貌似jnni是这样做的

2.UGC,由用户产生,douban等很多都是这样搞得

3.系统产生,利用用户/item数据

4.人工和系统相结合

解决了tag产生的问题,构建tag体系后,我们只需要抽取相关的feature,就可以完成item推荐或者tag推荐。

tag产生

工程上分析一下如何生成tag:

1.专家标注

目前大多数公司不现实,尤其是startup时,不可能有这么大的投入。

在垂直领域,这个问题可以简化,成熟的相关网站抓取,比如3C类,可以去京东,中关村在线等,结构化数据,效果不错。

覆盖率可能不够,但是作为startup公司或者要求不高时,应该够用,如果做深,是一个无底洞,taobao N多人N年搞产品库,投入很大。

所以有朋友希望兼职做做产品库挖掘,尤其说类似淘宝那种,直接拒绝。

2.UGC

tag的获取不是问题,产生的tag有很大的随意性,问题在于如何处理这些tag,主要问题:

1.书写不规范,最重要的问题,比如 美女,大美女,recomend system recomendation system, RS 等等,需要做归一化

2.同义关系

目前UGC 产生标签,是最主要的形式,不过产品前期比较多,稳定后用户更多的会采用推荐的tag

3.系统产生

用系统产生tag,基于user或者item信息,最简单的方式,将用户访问item的title取出来&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值