实际生活小例子
我们平常去商店买瓶水,我们比较熟悉之后知道在哪个货架,一下子就能找到。
我们想买手机的时候,去某宝或者并夕夕搜索华为xx然后选择合适的购买。
但这有一个前提,都建立在客户有明确需求的情况下。
另外一个因素是当今时代“信息过载”,可能一个便利店的商品不多,你逛几次就熟悉得差不多了,但是中百仓储那么多货品,对我这种路盲来说,不迷路就算成功。
即使某宝和并夕夕的搜索引擎很强大速度也快,但是偌多的商品却只是让用户去主动搜索购买,未免对用户的主动性有太多要求;搜索引擎也表示俺是辅助用的,不是主c好吧,你是卖商品的平台,不是谷歌不是百度。
当你点进一个电商网站,面对琳琅满目的商品时,你是否手足无措?当你点进豆瓣想找电影看的时候,各种几十年代各种类型的电影是否让你难以甄别?这时候就需要你的好兄弟登场了
这时候有个靠谱的好兄弟,帮你推荐东西,解决你的选择困难症还能帮你避开"坑货"。
然后你的好兄弟不是工具,也有忙的时候,也有睡觉的时候,不能可能无时无刻为你服务,比如:
当然,你的好兄弟不是没有感情的服务机器,说不定可能因为某些小事和你冷战一段时间,比如:
这些时候好兄弟靠不住了,他有他的想法,他不是你的工具人,那么你需要的是什么,一个自动化的工具,能推荐东西给你,还24小时为你服务,莫得感情任劳任怨。
推荐系统应用
在信息过载的时代,无论是信息生产者还是消费者都收到了极大的挑战。信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者, 如何让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。
那么推荐系统的基本任务就是联系用户与信息,实现双赢,解决信息过载。
如今推荐系统应用广泛:
①电商
最具代表性的就是有着“推荐系统之王”称呼的亚马逊。
②视频
网飞和油管
③社交
脸书
④音乐
网易云
④其他
广告营销、基于位置推荐、个性化邮件。
推荐系统评测指标
用户满意度
可以说是任何面向客服的产品都必须且及其重要的指标,但其他主观性较强且没有办法离线计算,一般通过用户调查得出,且对于问卷调查的设计必须要巧妙且摸清用户思想,不然就退化成评分了。比如举个例子,你对我们推荐给你的商品满意吗?
①十分满意。
②推荐对了,但是我看过了。
③虽然和我要买的分类有关,但我其实不喜欢。
④推荐的我完全不感兴趣,我不知道为什么会推给我。
其实这一系列回答有个致命缺陷,无法把握用户的某个“中间”感受。假如我对于推荐的物品大部分满意,但对某些小方面不太喜欢,这的话我就不知道这个问卷该怎么选择了。然而现实生活中往往这样“折中”的比较多。
预测准确度
该指标可以通过离线实验计算,算是一个比较常用的指标。
常见的有
均方根误差(RSME)和平均绝对误差(MAE):
准确率Precision和召回率Recall:
其中R(u)是根据用户在训练集上的行为给用户作出的推荐列表,而T(u)是用户在测试集上的行 为列表。
实时性
简单来说就是推荐的东西是否能随着用户的一个重要行为迅速作出改变以及系统中加入新的物品的能否快速的推荐给用户。
健壮性
比如很多水军刷分,然而评分是推荐系统重要指标,这样显然会影响推荐;另外雇佣水军模仿用户针对某个商品的行为,使得该商品被推荐到相似行为用户。这些“攻击”都需要防范,如果攻击后的推荐列表相对于攻击前没有发生大的变化,就说明算法比较健壮。
覆盖率
是否所有商品都能兼顾到,去除马太效应,不能旱的旱死,涝的涝死,推荐的总是热门榜前几就没意思了,就失去了推荐系统的灵魂,推荐系统的一大作用就将非热门商品推到契合的用户眼前,实现其甚至不输与热门商品的潜在价值。
其他
下面的就提一提,具体的可以看相关方面的文献
多样性
推荐结果要尽量覆盖用户感兴趣的多个领域,不要老在一棵树上吊死。
新颖性
指给用户推荐那些他们以前没有听说过的物品
惊喜度
推荐物品是和用户历史上喜欢的物品不相似,但用户却觉得满意的推荐
信任度
你是愿意听一个靠谱的好兄弟的话,还是听一个谎话连篇,喜欢吹牛的人的话?即使对方是莫得感情的机器,也存在信任度问题。一般通过增加系统透明度和充分利用用户社交好友的信息来提高信任度,因为运行机制足够透明,用户才能予以信任,且用户一般对好友都比较信任。