【推荐架构day5】今日头条算法的基本原理

最新推荐文章于 2024-05-16 14:09:42 发布

软件真理与光

最新推荐文章于 2024-05-16 14:09:42 发布

阅读量6.8w

点赞数 18

分类专栏：业务技术文章标签：架构后端

本文链接：https://blog.csdn.net/Ture010Love/article/details/104445295

版权

本文由今日头条资深算法架构师曹欢欢博士分享，揭示了今日头条推荐算法的基本原理，包括系统概览、内容分析、用户标签、评估分析等方面。推荐系统通过拟合用户对内容满意度的函数，综合考虑内容、用户和环境特征进行个性化推荐。内容分析涉及文本、图片和视频的处理，用户标签涵盖兴趣、行为等信息。评估分析强调多维度指标的综合评估，以优化推荐效果。内容安全是重要环节，通过审核机制和模型确保内容质量。

摘要由CSDN通过智能技术生成

本文来自今日头条曹欢欢博士的分享。今天，算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配，但同时，算法也开始面临质疑、挑战和误解。今日头条的推荐算法，从2012年9月第一版开发运行至今，已经经过四次大的调整和修改。

今日头条委托资深算法架构师曹欢欢博士，公开今日头条的算法原理，以期推动整个行业问诊算法、建言算法；通过让算法透明，来消除各界对算法的误解，并逐步推动整个行业让算法更好的造福社会。

以下为《今日头条算法原理》全文。

今日头条资深算法架构师曹欢欢：

本次分享将主要介绍今日头条推荐系统概览以及内容分析、用户标签、评估分析，内容安全等原理。

一、系统概览

推荐系统，如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数，这个函数需要输入三个维度的变量。第一个维度是内容。头条现在已经是一个综合内容平台，图文、视频、UGC小视频、问答、微头条，每种内容有很多自己的特征，需要考虑怎样提取不同内容类型的特征做好推荐。第二个维度是用户特征。包括各种兴趣标签，职业、年龄、性别等，还有很多模型刻划出的隐式用户兴趣等。第三个维度是环境特征。这是移动互联网时代推荐的特点，用户随时随地移动，在工作场合、通勤、旅游等不同的场景，信息偏好有所偏移。结合三方面的维度，模型会给出一个预估，即推测推荐内容在这一场景下对这一用户是否合适。

这里还有一个问题，如何引入无法直接衡量的目标？

推荐模型中，点击率、阅读时间、点赞、评论、转发包括点赞都是可以量化的目标，能够用模型直接拟合做预估，看线上提升情况可以知道做的好不好。但一个大体量的推荐系统，服务用户众多，不能完全由指标评估，引入数据指标以外的要素也很重要。