联系用户与物品的几种途径:
打标签:专家;普通用户(UGC,user generated content)
4.1 UGC标签系统的代表应用
4.1.1 delicious:用户给每个网页打标签
4.1.2 citeulike:论文打标签
4.1.3 last.fm:音乐打标签
4.1.4 豆瓣:对图书和电影打标签
4.1.5 Hulu:对视频打标签
标签系统最大优点:发挥群体智能
4.2 标签系统中的推荐问题
2个问题:
(1)基于标签怎么推荐?
(2)打标签时,怎么推荐适合的标签?
4.2.1 为什么要打标签
方便查找,方便使用
4.2.2 如何打标签
4.2.3 打什么样的标签
标签分类:
物品是什么、物品种类、谁拥有、用户观点、用户相关标签、用户任务
比如Hulu对电视剧的标签分类有:
类型、时间、人物、地点、语言、奖项、其他等
4.3 基于标签的推荐系统
(1)一个简单的算法
对于每个标签,统计被打过这个标签最多的物品
对于每个用户,首先找到他常用的标签,然后找到这些标签对应的最热门的物品给这个用户
(2)改进算法
惩罚热门物品,提供新颖性:TF-IDF、数据稀疏、标签清理;基于图的推荐方法。
豆瓣兴趣云:
4.4 给用户推荐标签
4.4.1 为什么要给用户推荐标签
方便用户输入标签;提高标签质量。
4.4.2 如何给用户推荐标签
(1)给用户推荐整个系统最热门标签
(2)给用户推荐该物品最热门的标签
(3)给用户推荐他自己经常使用的标签
(4)将(2)和(3)融合
另外:基于图的标签推荐系统