文章目录
资料整理,来源于北大刘宏志教授讲座内容。
在介绍推荐系统前,我们先想一个问题,为什么要有推荐系统?在推荐系统没有出现前,难道我们就不能更好的生活?
其实这方面主要归因于,互联网技术的迅猛发展,带来信息爆炸,进而我们接触到的信息都是超载的。
我们将转变接受信息的理念:”多即是少、少即是多“。
试想,我们去逛超市,面对琳琅满目的同类商品,是不是也会犯”选择困难症“。
1.推荐系统概念
关于推荐系统概念,我们可以认为:
- 推荐系统是一种主动的信息过滤系统;即将信息过滤的过程由”用户主动搜索“转变为”系统主动推送“。
什么样的系统需要用户主动搜索呢?我们常见的就是不同的搜索引擎,如:百度、Google等。
用户主动搜索建立在两个前提:
- 用户知道自己要什么
- 用户知道自己该如何描述
而推荐是挖掘并且满足用户的潜在需求,如:今日头条、Amazon等。
同时,推荐系统还是一种双边匹配系统,把恰当的商品(信息)推荐给人:
- 帮助用户发现其所喜好的或需要的小众、非主流商品;
- 帮助商户将其商品展现在对它们感兴趣的用户面前。
这一切正如《长尾》的作者 Chris Anderson 所言:
- We are leaving the age of information and entering the age of recommendation.
2.推荐系统发展历史
如果我们想要遇见将来,适当的途径是研究这门学科的历史和现状。
信息过载、推荐系统,这些词语并不是最近才被人提及。
推荐系统的整个发展历程又是怎么变化的呢,请看下面梳理内容。
参考资料可以点击下原文查看
3.个性化推荐系统框架
基于公式的描述:
-
映射函数 f : U × I → R f:U×I→R f:U×I→R
-
输入:
- 用户画像(U):评分、偏好、人口统计学资料、上下文等
- 项目画像(I):项目描述(属性)、内容等
-
计算:兴趣度或相关度(R),用于排序
-
输出:针对每个用户,给出项目排序列表
用户画像,即对用户的特点和兴趣进行建模
-
从用户相关的各种数据中挖掘或抽取出用户在不同属性上的标签
-
例如:年龄、性别、职业、婚姻状态、兴趣、未来可能行为等
项目画像,即对项目的特点进行建模
-
从项目相关的各种数据中挖掘和抽取出项目在不同属性上的标签
-
实现对项目(例如商品、服务等)的精准的定位
4.部分案例
4.1 搜狐视频个性化推荐架构
4.2 今日头条推荐系统架构
4.3 Netflix推荐系统架构图
5. 视频推荐系统流程设计
构建用户画像:
-
输入数据:用户注册数据、行为日志、系统展示日志 等
-
事实标签:性别、年龄、地域、人群(学生、上班族等)等
-
模型标签:主题偏好、兴趣标签(明星、导演、风格等)等
-
预测标签:用户活跃度、用户价值 等
视频(项目)画像:
-
输入数据:视频描述、视频内容、相关用户信息 等
-
事实标签:主演、导演、出品人、主题 等
-
模型与预测标签:评分、热度、关键词 、适合人群等
最后目标:
总结
本文主要对推荐系统做了基本介绍,从推荐系统为什么会出现,然后讲解了推荐系统基本概念,以及推荐和搜索的区别;梳理了推荐系统的发展历史,推荐系统主要架构,部分推荐系统案例;最后自己设计了一个视频推荐系统整体流程。