给用户推荐物品的方法中基于物品属性的方法可用隐语义模型得到。一种重要的特征表现方式是标签。打标签的方式有两种,一是专家给物品打标签,另一种是让普通用户给物品打标签(UGC)。当用户对一个物品打上标签时,该标签一方面描述了用户的兴趣,另一方面表示了物品的语义,将用户和物品联系起来。
一、代表应用
1.Delicious:允许用户给每个网页打标签,通过标签重新组织整个互联网。
2.CiteULike:论文书签网站,允许研究人员收藏自己感兴趣的论文并给论文打标签。
3.Last.fm:不进行复杂的音频分析的情况下获得音乐内容信息
4.豆瓣:对图书和电影打标签
5.Hulu:对电视剧和电影进行标记
UGC的优势:可发挥群体的智能,获得对物品内容信息较准确的关键词描述,是提升个性化推荐系统性能的重要资源。
二、标签系统中的推荐问题
1. 用户为何进行标注?
首先是社会维度。给内容上传者使用的,便于上传者组织自己的信息;给广大用户使用的,便于帮助其他用户找到信息。其次是功能维度,便于更好地组织内容,方便用户未来查找。
2. 用户如何打标签?
用户行为数据集中用户活跃度和物品流行度的分布都遵循长尾分布。标签的流行度也呈现非常典型的长尾分布,它的双对数曲线几乎是一条直线。
3.用户打什么样的标签?
表明物品是什么、物品的种类、谁拥有该物品、用户的观点、用户相关的标签(如我最喜欢的、我的评论等)、用户的任务(找工作、即将阅读等)等。
三、基于标签的推荐系统