工业界通用推荐系统架构及NetFlix经典架构解析

 

2个关键因素决定机器学习模型预测效果好坏

 

在这个页面里面,它相当于是给大家披露了一种比较标准的,算是行业的解决方案,对于不同的公司,每家公司业务是不一样的,但是每家公司背后的技术框架、基本思想是统一的,

OK你可以认为这个是一个每家公司都要去遵守的一个就是统一的一个技术思路在,只不过是每家公司它可能给你看到技术方案的长的不一样,但是它的方案可能也就是呈现形式不一样,但是如果我们一旦要抓住背后的精髓,比如这张图我们就可以觉得每家公司其实技术都是统一的,都是通用的,对吧?“蜡炬教育AI学院” 比如在这里面我们把整个的方案分成三个层次,对吧?

 

从下往上就分别是这是数据层更偏底层对吧?底层大家都清楚,底层一般都是做什么的?都是做一些存储的,对不对?底层存储底层就是更切更贴近于你的磁盘,对吧?我们要做数据挖掘,首先底层要存数据,他要存什么数据呢?

存业务数据和日志数据,那是业务数据,什么叫业务数据?什么叫日志数据?业务数据就是用户的数据,比如说用户的性别、年龄、兴趣,还有一些什么家庭住址,或者是一些用户是不是有没有开会员,然后他的钱包里面有没有钱,甚至他有没有收藏一些信息等等,

这是用户数据,商品数据相当于是物品的原数据,比如说你在听一首歌或者是看一段视频,这个视频背后就是一个商品,你可以认为把它当成一个商品或者物品,比如说我们拿视频也好,物品数据包含什么?包含视频的自身的标题,演员。

什么属于地域?是什么国国产片,还是港台片,还是什么欧美等等,还有一些什么风格,对不对?“蜡炬教育AI学院” 是战争还是怀旧还是怎么样的,对不对?它有很多这样的字段,所以这些字段都是属性,这大家能理解吧?都熟悉,能理解吧?

 

你拿任何一个视频,拿任何音乐,其实都有这样的属性。好了,比如说商品它有什么属性?商品它也有类似的,只不过是商品里面可能会有一些价格分类信息,对不对?这个比较好理解,日志数据什么意思?

日志数据能够更好让我们抓住个性化的一些用户行为数据,比如说通过一些买点前端和后端能够拼接出能够回应出这个人在我这个网站上他留下了一些哪些记录,对不对?“蜡炬教育AI学院” 比如说他过来看了一部电影,好了,他肯定是点了我这个网站在前端买点上,我就可以记录下来,他在今天几点几分几秒点了这个视频,然后在几分几秒,他把视频的窗口往前拖动了多长,对吧?然后他什么

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值