1.a contest between satisfaction and temptation

1.摘要

手机应用推荐有一个不同于传统商品推荐的显著特点:用户会考虑用新的app来取代旧的。于是带来现有app的目前实用价值和备选app的吸引价值的竞争。


2.我的想法

 针对此特点,我可能会想做两种类型的推荐:(1)同一类型的app推荐,如类似的天气预报软件,考虑满意度和吸引度;(2)根据其使用的app分析其特征(性格,职业,爱好等),根据特征推荐app。

 第二种类型可用传统的基于用户的协同过滤算法。第一种可在传统的基于物品的协同过滤算法上改进。

满意度和吸引度对选择的影响衡量问题。


3.具体操作

(1)计算两个app功能的重叠程度

假设功能来自app的描述,用余弦相似度表示。


(2)对一个app的评分


UIR感兴趣程度,ACR吸引度。


(3)下载一个app的概率密度分布函数——贝塔分布

贝塔分布详解:http://www.zhaokv.com/wiki/ai/machine_learning/prml/probability_distribution/binary_variable/beta_distribution



(4)1)针对已有的一个app和推荐的一个app相比的概率

               服从伯努利过程

          2)针对用户所有app和推荐的一个app相比的概率

               将用户已有的每个app与推荐的app的相似度作为权重,累乘作为综合概率。


(5)数据格式为形如的四元组。用对数似然函数求取在数据最大化时AV和TV的值。用最大期望算法对公式进行处理,引入下载和未下载的用户数n_ij和m_ij来去掉目标函数中的u变量。通过求偏导来进行梯度下降。最后综合得出AT模型的评分与成正比


(6)从数据中发现AV和TV。

app的平均评分和app的actual value作图发现其大致成正比;用一个app的下载概率(下载/浏览)和app的tempting value作图发现其也大致成正比。


(7)求解AV/TV的比值。

          1)负比,AV小。类似书籍,属于一次性消费。

          2)0左右。类似说明和指南,确定性消费。

          3)正比,AV大。功能强大型app,难以被取代。


(8)数据预处理。

选取最近25%的记录作为测试集。


(9)评测指标。

使用相对准确率和召回率。经过处理,两者相同,只需计算其中一个。


(10)选取collaborative filtering (CF) and content-based recommendation (CBR). Specifically we use probabilistic matrix factorization (PMF) [22] to realize CF and support vector machine (SVM), implemented by LIBSVM [5] to realize CBR.多个模型进行对比评测。


(11)对测试集的大小,参数的选择,迭代次数等进行评测。


4.不足

(1)忽略了稀疏集的处理。数据集预处理时剔除了稀疏数据。(We remove users who have conducted less than 100 actions and then remove apps that have less than 10 visitors.)

(2)稳定性测试??


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值