个性化推荐系统中的BadCase分析

针对内测用户反馈,由于前一天点击了几个动画,导致第二天推荐的动画屏占比较高,于是开始对此badcase进行分析。

首先分析了该用户的历史观看纪录,由于系统升级,日志缺陷问题,导致该用户10.15-11.3之间的日志没有收集到,但是这就出现了前面的假设不成立现象,由于没有收集到新的数据,对用户画像是不可能体现出前天的动画,动漫以及迪斯尼这些具有偏重的画像词。

首先对问题进行了分析,问题可能出现在时间间隔上,因为我们引用了时间间隔作为用户对某一电影的喜好偏爱权重的计算,导致这个问题可能有两方面原因:

1.随着时间的推移计算,某些对用户的画像的词出现了小的波动,但是这些小的波动可能会导致不可预料的后果,例如:在问题出现前对用户的画像可能是:

person艾恩·贝利:2.694,伊万·阿达勒:1.992,苏菲·玛索:1.897 label苏菲·玛索:0.451,让·雷诺:0.361,逃之夭夭:0.271,你丫闭嘴:0.271,SophieMarceau:0.226,JeanReno:0.226,八面埋伏:0.203,法国:0.169,法国电影:0.155,悬疑:0.130

但是时间推移之后某些权重开始凸显出来变成下面这样:

person阿兰·里奇森:3.979,赖虹宇:3.979,郭度沅:3.678 label迪斯尼:1.186,动画:1.129,浪漫:1.119,经典:1.028,3D:1.010,奇幻:0.940,国漫:0.900,效果好:0.800,侏罗纪公园:0.800,斯皮尔伯格:0.775

分析发现,person 中三个演员属于偏冷门演员,所以电影不会太多,label标签中迪斯尼,动画这两个具有极大的代表性,他们覆盖了动画非常之多,导致推荐的都是动画之内的,这样效果肯定不好,后期可以做一些处理,但是问题来了,是不是时间原因导致的这个情况?或者还是用户真的看了许多动画类的行为电影导致的?通过日志继续查找原因。

发现自10.17号该用户升级了APP到4.1.0,而该版本的APP有一个Bug,在发送vv日志的时候不会发送用户点击的电影ID,导致了该用户最新的观影记录没有有效的记录,导致推荐的数据都是基于以前的用户行为推荐。但是为什么动画在以前的权重这么明显呢,深入代码发现我们在日志处理环节做了一个FeedBackLogwithRate,这个处理的目的是当用户提交了已看过和不喜欢的电影,特别是已看过的电影,我们会将用户的这一行为当成该用户的一种最新行为,距离当前观影日期最近的行为,导致推荐的问题复现。

另外一方面导致这个问题的原因是在usermovieA 环节,因为我们在糅合用户画像之后与电影进行匹配的过程中,本身库中某些大标签他的电影数就多,如:韩国,爱情,成龙,周星驰,青春等,我们在这一块只是做了一个权重的排序,在这一块很难有一个区别度去对各个类别都选择,所以我当前的另外一个思路就是对某一个类别或者标签只取一定量,超过这个量就不在增加。目前还在测试中。

转载于:https://www.cnblogs.com/peizhe123/p/6042520.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
一、课程背景 1. 正在网上看视频的你,是否看了网上很多的视频,却始终迷迷糊糊、不成体系? 2. 正在看书自学的你,是否在学习过程遇到了很多问题,但始终不得其解,而且还找不到人问,没有人快速给你解决? 3. 正在学校上课的你,是否对每个模型和算法都能说个大概,但却不知道它们在公司里是如何应用的,想一探究竟,却始终得不到答案? 4. 正在读研的你,是否因为导师强塞的方向和巨大的压力无法短期入门精通而焦虑万分? 5. 正在找工作的你,是否投了很多公司的简历(巴不得一上午投完所有招聘的公司),但投了之后,简历始终都是石沉大海、杳无音讯? 6. 正在做机器学习工作的你,是否技术上遇到了瓶颈,对模型的选择/调优、特征工程等不够熟练,导致在团队竞争力不够,从而升职加薪困难? 因为机器学习是一门实战性极强的学科,所以看一个课程是否有真正的工业实战,一看讲师团队是否是公司里多年实际带队做机器学习的,二看教学理念/侧重。 第一方面,本课程的所有讲师均全部来自BAT + Google的一线技术大咖亲自授课,是真正工业人士授课的工业课程,帮助学员实际理解这些机器学习理论模型算法到底是如何应用在工业实践的。  第二方面,如上所说,网上视频很多,但由于没有个性化的内容、辅导、答疑,导致不少初学者看再多视频,视频看再多次,都是迷迷糊糊、不成体系,故本课程一直维持着讲师助教组长高水准答疑,助力找/换工作和升职加薪。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值