定义:
根据维基百科的定义②,标签是一种无层次化结构的、用来描述信息的关键词,它可以用来描述物品的语义。
应用:
Delicious, CiteUlike, Last.fm, 豆瓣, Hulu
使用方法:
通常用户喜欢给物品打标签,也喜欢给自己打标签。我们也可以通过标签来记录用户的兴趣和衡量物品的语义,从而将物品和用户联系起来。
标签系统中的推荐问题主要由一下两个:如何利用用户打标签的行为为其推荐物品,如何在用户给物品打标签时为其推荐适合该物品的标签(标签推荐)。
因此我们需要解答:用户为什么要打标签、用户如何打标签、用户打什么样的标签。
因此我们可以通过衡量标签的余弦相似性来衡量物品之间的相似性,同时也可以根据给物品打过标签的用户数来衡量物品的平均热门度。
同时我们也可以对标签数据进行处理和清理:去除词频很高的的停用词、去除词根不同的同义词、去除分隔符的同义词。
推荐的时候我们可以解释用户之前使用过切物品有标签数据,给出了用户对标签的兴趣和标签与物品的相关度,但还可以给考虑 标签与用户的兴趣度、标签和物品的相关度、以及选择哪一种方法进行排序。
在给用户推荐标签的时候,我们可以选择。给用户u推荐整个系统中最热门的标签、物品i上的最热门标签、u经常使用的标签、多种方法融合。
什么样标签:
1 表明物品是什么 比如是一只鸟,就会有“鸟”这个词的标签;是豆瓣的首页,就有一个标签叫“豆瓣”;是乔布斯的首页,就会有个标签叫“乔布斯”。
2 表明物品的种类
3 表明谁拥有物品 比如很多博客的标签中会包括博客的作者等信息。
4 表达用户的观点 比如用户认为网页很有趣,就会打上标签funny(有趣),认为很无聊,就会打上标签boring(无聊)。
5 用户相关的标签 比如 my favorite(我最喜欢的)、my comment(我的评论)等。
6 用户的任务 比如 to read(即将阅读)、job search(找工作)等。
7 类型、时间、任务、地点、语言、奖项、其他。