背景
Flickr是著名的图片存储应用提供商,被yahoo收购。这里的两个作者都是yahoo位于spain Barcelona研究院。
Tag的对象都是缺少内容的。这里是对图片、用户和朋友、视频的标注。QQ、旺旺、开心网都有过对好友印象,这个或许是为了给用户做标注。不过给用户做标注容易太宽泛。
同一张图片,不同的人标注的结果可能很不一样。
论文结构
这篇论文的论述方式非常好。先介绍相关工作,然后研究宏观数据,对要研究的问题,的数据上有清晰的认识;再介绍各种算法;最后介绍评测和结论。
论文主要内容
本论文有两个方面的贡献。一、我们分析“用户怎么标注图片”;二、用户提供什么类型的tag。
在不可思议的大量用户标注的基础上,我们可以导出tag之间的挂关系,使用全局共现的方法。
Tag共现,也用于用户tag的候选。
有四种Tag推荐方法,
Tag的两种应用方法:供用户选择标注;增加图片索引。
相关性:
(1)jaccard coefficient
(2)非对称的条件概率
推荐方法:
(1)每个tag得到一个相关性集合,根据投票选择得票最多的tag
(2)根据条件概率,选择得分最大的tag
评价:
MRR