实现实时个性化推荐_个性化推荐系统研究热点—智能推荐与实时服务

这篇文章我们主要介绍和讨论的是关于智能推荐服务的技术发展要求和发展中出现的问题,并以今日头条为例探讨智能推荐的发展特征。

一、场景化以及实时个性化服务的实践

场景化智能推送作为一种新兴的形式,其实现主要依靠三种要素

1、冷数据画像:性别、兴趣、常驻地、职业、收入和年龄段等相对稳定的数据画像。;

2、温数据回溯:近期活跃应用、近期去过的地方等具有一定时效性的行为数据。

3、热数据场景:当前地点、打开的应用等场景化明显的、稍纵即逝的营销机会。

b7391955a246f8bf1eea2095c259a541.png

二、场景推送系统

智能场景推送系统需要具备几个功能:实时识别用户场景、支持人群筛选、高可用高并发的推送、通知APP开发者的能力。

三、大数据系统

智能推荐中的大数据系统要求构建用户标签系统,实现冷热画像。做标签体系的前提是要对各类行为做一些分析和预测模型的建立。同时建立位置定位信标库和算法,统一设备ID服务。做到海量行为数据实时或者准实时处理,支持系统运营的需求(指标计算和异常发现等)。

四、遇到的一些数据问题

1.设计统一的设备ID,聚合多来源数据,实现画像的完整性等。

2.基于数据设计请求处理策略,避免系统上线后受脏数据干扰。

3.全链路监控及时发现异常点,用数据来运营系统。

4.实时系统中数据倾斜问题。

五、信息流的必然性及其进化(以今日头条为例)

1.今日头条简介

af10a394ff9689ef47ae4e2098a6cb0f.png

今日头条是北京字节跳动科技有限公司开发的一款基于数据挖掘的推荐引擎产品,为用户推荐信息,提供连接人与信息的服务的产品。由张一鸣于2012年3月创建,2012年8月发布第一个版本。

2016年9月20日,今日头条宣布投资10亿元用以补贴短视频创作。后独立孵化 UGC 短视频平台火山小视频。2017年2月2日,全资收购美国短视频应用Flipagram。 2018年8月,CB Insights公布2018年全球独角兽企业榜单,今日头条排名第3位。

今日头条的特性在于——内容的极度去中心化。在今日头条,内容生产者发布的内容,首先要被算法识别和推荐,然后再分发给用户。在今日头条中用户更加注意获取内容的效率和内容的精准性。如果说微博增强了用户中心化趋势,那么今日头条则是极度的去中心化趋势。

aa8643240b4135ba71dd0fc06684f6e6.png

2.今日头条算法的基础公式:

Y=F(Xi,Xu,Xc)

今日头条算法的本质是解决用户和环境、内容之间的匹配性问题。其基础维度有三:

第一,内容。

今日头条是一个全内容平台,所以在算法运作时候要考虑到内容特征。

第二,用户。

每一个用户都有自己独特性,但同时在某个维度下又有共同性。所以在算法运作时候要考虑到用户特征。

第三,环境。

这是移动信息时代的特点,在不同的场景下,你的阅读爱好是会有所偏移的。所以在算法运作时候——要考虑到环境特征。

结合这三个维度,算法会给出预判,预测该内容是否能对某一情景下的某一用户产生正面反馈。其实,不只是今日头条,其他内容平台都是这个模式。

5f037b775331aff5996f572168e2dba3.png

3·四个推荐特征:

第一·匹配性特征:

即然算法是用来解决内容和用户匹配性的,那么精准的内容必然会获得头条更多的推荐量。那么关键词、分类和主题的选择就显得尤为重要。

第二·环境特征:

即然算法是用来解决环境和用户匹配性的,那么贴合时间点、贴合地理位置、必然会获得头条更多的推荐量。

第三·热度特征:

所有用户都在关注的热点会被多推荐,一个类别下(比如娱乐、体育)大热的内容会被多推荐、一个主题下(比如说:NBA季后赛)大热的内容会被多推荐、一个关键词下(詹姆斯)大热的内容会被多推荐。

第四·相似性特征:

通过用户行为分析不同用户间相似性,从而提高推荐的效率和准确性。

图片来源网络 如有侵权请联系删除

作者:连九港 郭泰森

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值