Recsys 2014 Automating Readers’ Adivsory to make book recommendations for K-12 Readers

作者:
Maria Soledad Pera           Yie-Kai Ng
Brigham Young University
名词说明:
K:Kindergadom   12:12年级,相当于国内高三

现在的系统存在的问题:
1.     没有考虑读者的阅读能力,对于青少年的确该考虑到
2.     受到信息保密等限制,目前很多推荐基于的信息都是拿不到的(交互、历史)

作者提出的方法:
主要思想:
从图书馆管理员图书推荐的思路来自动实现推荐,考虑的维度有:①topic ②content ③appeal factors (appeal-term description)

实现的框架:


Reader R的profile是一个N本已经阅读过的书集
待推荐的书是从网站、图书馆等找到的书 BiblioNasium
Topic来自于LCSH(一个图书索引,可以提供类别等信息)
Content是从网站上抓下来的内容简介
Appeal-term是文章的重要创新点
公式①

公式②

公式③



公式④

公式⑤

创新点:

最重要的是 ABET(Appeal-based extraction tool),即如何得到appeal-term description
首先考虑的角度:Appeal factors 


其次设计的规则:
rules that eamine typed dependencies relations between word pairs in sentences extracted from reviews
Typed dependency 是基于Stanford typed dependencies manual(provide a simple description of the grammatical relationships in a sentence)
步骤
1.     借助与wordnet,对7个appeal factors里面的词进行了扩充。
2.     具体的规则

说明:
Rule 1 & 2:句子的主语或者宾语是factor,那么与这个主语/宾语之间关联的语义词就是appeal term
Rule 3:通过语法关系来得到不是直接相关的appeal term
Rule 4:考虑否定词,not等
Rule 5-7基于介词、主语、宾语来得到Frame和special topics相关的appeal term

对每本书的reviews处理后得到的结果是

说明:
括号里面的是出现的次数,frequency,可以代表权重。

作者通过一是通过与人工标注的结果进行对比;二是通过survey的方式 证明了这种方法抽取的appeal term的准确度很高。
错误分析:读者的review内容很多样化,所以虽然对appeal factors进行了扩充,还是存在一些keyword没有包含进去;poor phrasing


还有一个小的创新点是计算content similarity的时候考虑了同义词

评论:
作者的思路还是比较好理解的,从主体、内容、appeal-factors。作者能够想到方法关键是联想了正常大家去图书馆选书时候的过程,advisory起到的作用。所以做推荐还是要多联想正常的人与人之间推荐过程是怎么样的,然后想办法让机器自动完成。
文中的appeal term提取方法看起来准确度非常的高,有机会可以试试。


回顾学习的内容
1.     相似度计算的时候经常会放在一起待选的方法:
Vector Space MOPPOodel VS. KL-divergence
VSM handles frequency distributions
Cosine similarity衡量的是两个向量的夹角
KL散度衡量的是两个分布的相似程度

PRML里面有对KL散度的原理说明

2. 评价指标nDCG
考虑相关度及其返回结果的位置。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值